文化行业

注册

 

发新话题 回复该主题

机器新闻写作媒体行业的探索研究与实践 [复制链接]

1#
白癜风人民大会堂活动 http://weifang.dzwww.com/cj/201711/t20171127_16268082.htm

在年1月,习近平总书记在中共中央*治局第十二次集体学习时强调,探索将人工智能运用在新闻采集、生产、分发、接收、反馈中,全面提高舆论引导能力。机器新闻写作作为人工智能与新闻业相结合的典型代表,是新闻业基于人工智能技术创新出的内容生产方式。在媒体竞争中,回归优质内容将是媒体内容生产的重要趋势,新闻内容的高质量和多元化是其主要竞争力,这势必会推动新闻内核的重归。机器新闻写作对搜集和输入的数据信息进行自动化的分析、处理和加工,进而根据特定的场景生成一篇较为完整的新闻报道,通常包括数据挖掘、知识图谱、自然语言处理、事理图谱、神经网络、深度学习等人工智能技术。

01

机器新闻写作应用现状

机器新闻写作最早起源于美国,至今仍然以绝对的优势领先,中国在第二批发展浪潮中表现亮眼,瑞典、英国、法国、丹麦等国家紧随其后。目前机器新闻写作的话题较为局限,以体育竞技与经济热点为主,包括体育赛况报告、财报解读等,社会民生、自然灾害、气象变化等话题占比合计仅为30%。

在国外,美联社、雅虎、华盛顿邮报、BBC新闻都已开始使用机器新闻写作技术来负责稿件的生成,其中,华盛顿邮报的Heliograf软件,只需编辑设置稿件模板,确定好关键词便可完成稿件编写,升级之后,可以用更加专业的评论语气和分析事情的思路进行写稿;BBC新闻实验室的Juicer在年被首次引入,它的任务包括新闻快讯、视频新闻、*府公告、社交媒体信息等在内的海量数据汇集,并进行自由调用,同时监控着余个媒体新闻源、*府信息源和部分互联网新闻源,再将其分门别类以供写稿使用。

中国的机器新闻写作研究起步较晚,但发展迅速,新华社的“快笔小新”在擅长的体育和财经领域,编辑记者需要用15~30分钟时间完成的稿件,小新只需要3~5秒钟,而且小新可根据文字自动搜索资源库匹配关联性最强的图片、视频、音频素材,自动制作成一段视频,同时支持语言配音。封面新闻的小封机器人在年世界杯期间总共推送了世界杯相关资讯多篇,获得了全网总阅读量超2亿的成绩。字节跳动Xiaomingbot作为首个3D多语言AI记者,除了新闻写作的基本功能外,还被赋予了3D动画形象,能够配合文本内容完成多种语言的新闻播报任务。

02

机器新闻写作技术支撑

人工智能的三大支撑为算力、数据与算法,机器新闻写作同样如此。算力被形容为支撑人工智能走向应用的“发动机”,芯片、加速计算、服务器等软硬件技术和产品的完整系统提供超强算力,帮助算法快速运算出结果。数据作为大数据时代的基石,为人工智能的实际应用提供“燃料”,大数据具备5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。算法模型是人工智能落地的“承载体”,其复杂度不断加深,解决问题的能力以及服务的业务场景也不断增强。

硬件平台支撑。在人工智能发展的早期阶段,以能力训练为核心,这一阶段更多的计算负载集中在离线的数据中心。在进入大规模应用阶段后,人工智能的能力赋能产品或行业解决方案,成为普适的应用技术,在这一阶段将呈现“云+端”部署、分散化、终端化、场景化的特点,对算力的需求也将迅速增长,更加多元化。

媒体大数据云服务平台基础。媒体大数据云服务平台涵盖数据采集、数据挖掘、自然语言处理、计算机视觉处理等一系列的相关技术与理论,并对海量文、图、音视频数据进行统一采集、处理、存储、检索以及深度智能挖掘分析的大数据平台。

数据采集。数据是起点,数据让机器新闻写作所需内容的关联、预测、分析成为可能。数据采集为大数据平台的基础,广泛、大量、多样性的真实数据保障模型的学习训练与优化。

大数据平台的数据源大致可以分为三类:互联网公开采集数据、中央媒体新闻稿件、媒体单位内部数据。由于外部数据的获取渠道不同,需要多种数据采集方式,以实现覆盖新闻/视频网站、微博、

分享 转发
TOP
发新话题 回复该主题