阅读率与人工稿件基本持平 机器写作正逐渐被接受

  • 时间:
  • 浏览:2

调查现象加载中,请稍候。

若长时间无响应,请刷新本页面

  近几年,机器写作不再是纸上谈兵的技术,已然渗透到了亲戚亲戚大伙的生活之中。今日头条、腾讯、百度、360 等公司,以及新华社、南方都市报、第一财经等传统媒体单位均开展了机器写作技术的研究与应用。

  不久前,在北京大学科技成果发布会暨北京市科技成果转化统筹协调与服务平台系列项目路演中,北京大学计算机科学技术研究所研究员万小军的AI写作机器人颇受关注。

  据介绍,这项成果已应用于多家媒体单位,研发单位与各媒体单位合作者者推出了小明、小南、小柯等多款写作机器人,各类机器人机会自动撰写新闻稿件十万多篇。

  除了新闻写作,还能应用于哪些地方地方领域

  机器写作,又称自然语言生成,是自然语言出理 领域的重要研究方向和研究热点之一, 也是人工智能走向成熟的句子的句子的句子期期 图片 的句子的句子是什么是什么的句子是什么是什么的重要标志之一。

  目前,机器写作在传媒、出版、文娱、广告等多个行业均具有广阔应用场景。欧美等地较早成立专注于机器写作技术应用的多家公司,类似ARRIA、AI、NarrativeScience等基于行业数据,通过机器写作生成行业报告或新闻报道,从而节省多量人力。一块儿,不少国外知名媒体单位纷纷采用机器写作技术进行新闻稿件创作,以节约人力成本,提高厚度。

  “与人类作者相比,机器写作具有厚度高、时效性好、覆盖性强、无偏见等优势。今日头条的线上测试表明,机器人撰写新闻稿件的阅读率与人工稿件的阅读率基本相同,这说明机器稿件的质量不错,不不还还可以 被广大用户所接受。”万小军告诉记者。

  万小军说,亲戚亲戚大伙希望计算机一块儿具有读与写的能力,除了掌握阅读和理解语言文字的本领之外,还不不还还可以 掌握文字创作的本领,从而像人类一样写出高质量的文字作品,类似新闻资讯、报告、诗歌、小说、作文等。

  然而,计算机不还还可以 不还还可以 凭空写作,不还还可以 不还还可以 根据所输入的数据与素材进行创作。据介绍,根据输入的不类似型的信息,计算机一般采用不同的写作方法进行创作。类似,计算机根据输入的形态化数据(报表、RDF数据等)进行文字创作,从而不不还还可以 生成稿件。这是目前机器写作应用的主要方法,适用于天气预报、医疗报告、赛事简讯、财经报道等文本的生成。

  万小军介绍说,近几年机器写作除了用于撰写新闻、报告等实用型文本之外,还被用于创作古诗、现代诗、散文等文学作品,类似微软小冰、清华九歌等系统分别不不还还可以 创作现代诗和古诗,在文字表现形式上的总体效果还不错,但在意境上有所过高 。

  厚度学习生成模型,但还难保准确性和可读性

  近几年,厚度学习发展太快,机器写作技术也受到其深刻影响。

  据万小军介绍,基于厚度学习技术进行文本生成,不依赖于模板或规则。然而,这么 的写作方法其随便说说研究上取得一定进展,但目前还不还还可以 不还还可以 保证所生成稿件的准确性与可读性,难以满足也不应用场景下对稿件的质量要求。此外,厚度学习生成的模型训练不还还可以 不还还可以 多量的平行语料,而在也不领域内较难获取到这么 的大规模语料。

  计算机根据已有的文字素材(类似机会发表的新闻)进行二次文字创作时,不不还还可以 基于已有稿件创作出不一样的稿件,主要依赖于两类自然语言出理 技术:自动文摘与文本复述。其中自动文摘用于对单篇文本或多篇文本进行内容提炼与综合,形成摘要或综述。

  万小军指出,多文档自动文摘比单文档自动文摘更具有挑战性,导致 在于不同文档内容的冗余性、片面性与弱连贯性。何如让,对多篇新闻报道进行长篇综述生成极其困难,其研究团队在这方面进行了尝试,提出基于段落排序与融合的方法为多篇新闻报道进行综述生成,取得一定效果。

  文本复述则用于对现有文字进行改写,在主题与意思基本不变的前提下产生另这名 文字表述,从而出理 原文照抄,也可实现文本风格化的目的。文本复述都不还还可以 不还还可以 看作是这名 单语言机器翻译现象,何如让在平行语料富有的前提下,各种统计机器翻译方法(包括神经网络机器翻译)均可应用于此现象。但现实中却难以获得大规模的此类平行语料,何如让针对文本复述的研究不还还可以 不还还可以 另辟蹊径,最新的研究主要集中在何如有效利用多量的平行语料和大规模的非平行语料进行复述模型的学习。(华 凌)

[ 责编:蔡琳 ]

阅读剩余全文(