如何评价今日头条研发的写稿onebot 机器人一体机Xiaomingbot

董湘伦 - 知乎赞同了回答1 天前阅读全文34 条评论分享收藏感谢收藏了回答1 天前阅读全文191168 条评论分享收藏感谢工具类服务
编辑部专用服务
作者专用服务
产学研合作路径下网红“Xiaomingbot”的前世今生——专访今日头条实验室技术总监李磊博士
“Xiaomingbot”是自动创作、辅助创作的一部分
《中国传媒科技》:里约奥运会之际,今日头条推出了“Xiaomingbot”写稿机器人,凭借其优异的表现引起了市场和用户的高度关注,推出这款产品的初衷是什么?
李磊:今日头条是一个基于大数据与人工智能的内容创作与分发平台,一边是内容创作者,另一边是读者,连接两边的是人工智能推荐算法.内容创作是其中的重要部分,我们希望能够通过技术来帮助更多的内容创作者和新闻工作者更好、更快地创作高质量内容.&Xiaomingbot”是内容自动创作或者说是辅助创作的一部分,我们希望“他”能够作为记者采编工作的补充.与此同时,我们也希望&Xiaomingbot”创作的内容是读者们希望看到的.
年,卷(期):
在线出版日期:
本文读者也读过
相关检索词
万方数据知识服务平台--国家科技支撑计划资助项目(编号:2006BAH03B01)(C)北京万方数据股份有限公司
万方数据电子出版社 上传我的文档
 下载
 收藏
该文档贡献者很忙,什么也没留下。
 下载此文档
“xiaomingbot”背后,写稿机器人的技术探寻——专访北京大学计算机科学技术研究所万小.
下载积分:1500
内容提示:“xiaomingbot”背后,写稿机器人的技术探寻——专访北京大学计算机科学技术研究所万小军博士
文档格式:PDF|
浏览次数:72|
上传日期: 18:41:33|
文档星级:
全文阅读已结束,如果下载本文需要使用
 1500 积分
下载此文档
该用户还上传了这些文档
“xiaomingbot”背后,写稿机器人的技术探寻——专访北
官方公共微信今日头条VS《华盛顿邮报》:中美机器人报道奥运大对比
OFweek机器人网讯:今年里约奥运期间,2家公司试水了机器人报道体育赛事,让人们看到了充满科技味道的新闻报道。一个是今日头条的头条实验室研发的AI机器人Xiaomingbot,另一个则是美国《华盛顿邮报》的Heliograf。自奥运开赛起,它们就开始了自己的“体育记者生涯”。让我们来感受一下机器人写稿的画风:
Xiaomingbot——今日头条黑科技
Xiaomingbot是今日头条实验室研发的AI机器人,目前可以做奥运会乒乓球、网球、羽毛球和女足的比赛报道。有数据显示,奥运会开赛6天以来,其共生成超200篇简讯和资讯。其写稿模块是由头条实验室与北京大学计算所(万小军团队)联合研发而成。这是国内第一款可以报道奥运赛事的人工智能机器人,在结合了最新的自然语言处理、机器学习和视觉图像处理的技术之后,通过语法合成与排序学习生成新闻。
Heliograf——《华盛顿邮报》的秘密武器
据《华盛顿邮报》的介绍,Heliograf主要通过人工智能来快速生成一些简单但有效的信息、比如奥运会的比分、金牌总数、以及其他的以数字为核心的报道,主要依托《华盛顿邮报》网站和该报Twitter帐号进行信息发布。《华盛顿邮报》官方称,机器人记者在奥运会期间将在Twitter推送600则消息更新。
这是第一个被机器人报道的奥运,我们有机会看到中文和英文两种语言环境下人工智能机器人的作品。蓝媒汇做了一些调研,将中美两个机器人的作品进行对比,从中窥见当下人工智能在自然语言处理和深度学习上的研究成果。
报道发布速度
对于体育赛事结果的报道,其速度是读者的重要需求,也是媒体们的必争之地。众多媒体都会在重要赛事比拼报道发布的速度,以此来彰显各自的新闻专业实力。
据了解,Xiaomingbot对接奥组委的数据库信息,实时撰写新闻稿件,能在2秒内生成并发布——跟电视直播几乎同步。在Heliograf的相关报道中,并未任何资料显示其在报道上的相关数据。
对比结果:虽然中国选手表现良好,但美国选手暂时数据缺席,所以本轮结果保留。
承载信息量
同样一件新闻事件的报道,承载信息量大的报道会更具有阅读价值。蓝媒汇比对了Xiaomingbot和Heliograf的信息量。发现:
Xiaomingbot的报道基本上包含了超过10个元素:包括比赛时间、比赛名称、体育馆名称、比赛规则、比赛持续时间、运动员姓名、运动员世界排名、比赛大比分、比赛小比分及运动员国际和年龄。并根据新闻人物添加了不同的配图。
据了解,Xiaomingbot使用智能选图技术,实现了给新闻配图。早已进入读图时代,在用户体验对多维度、可视化新闻的追求下,图片日渐成为新闻的重要呈现方式。
Heliograf相比较下来就freestyle了,元素基本包含的是时间、运动员姓名、运动员国籍、比赛名称、比赛结果共5种元素,并且无比分结果(无奈摊手)。截止8月12日下午5点前,还没看到twitter上有配图,其播报元素在现今多媒体时代,不免稍显匮乏。
对比结果:中国选手Xiaomingbot完胜。
新闻的可读性也是衡量一家媒体专业水平的重要标准之一,可读性高传播量才大。这方面,Heliograf显然更“一本正经”,叙事平实,可能碍于twitter仍旧140字符的限制,用词简单明了。
而Xiaomingbot则除了典型“新闻腔”,还有人格化播报。如网球女子单打四分之一决赛的报道:「在北京时间8月11日23:30时,奥运会网球女子单打四分之一决赛中,来自乌克兰的选手伊莉娜-斯维托莉娜在比赛中让大家知道,“他不是一个人在战斗”」怎么突然就变健翔老师了?
歪,110吗?这里有个机器人成精了。
对比结果:Xiaomingbot完胜,俗话说得好:不会写段子的机器人不是好写手。
播报比赛项目
在播报项目数量上,中国选手Xiaomingbot不敌美国选手Heliograf,暂时只有乒乓球、羽毛球、网球和女足4项。经统计,Heliograf则囊括了柔道、跳水、自行车、射击、举重、橄榄球、马术、赛艇、击剑等近10个赛事项目。
对比结果:美国选手Heliograf胜出。
能否长文报道
在体育赛事中,长文资讯用来报道整个比赛过程,回溯精彩环节,同赛果短讯相辅相成。Xiaomingbot已经可以完成800多字的长文资讯。在下图报道中,Xiaomingbot不仅以大数据来分析女足出线形势,更是详细描述了赛场上发生的激烈比拼的过程。比如“下半场刚开始不久,外围谭茹殷的一脚远射,高了”等细节。Heliograf暂时没有看到长文资讯作品。
对比结果:Xiaomingbot胜出。(哎,你让几球,让几球,你看它都要哭了)
目前为止,两个机器人的报道发布平台都是当前语言环境下最热门的平台twitter、今日头条。据资料显示,其中最受欢迎的一篇报道是《奥运会乒乓球女单铜牌赛金宋依(朝鲜)4:1奥运名将福原爱(日本)轻松摘铜》,阅读量已经达到了55555次阅读。
Heliograf由于传播平台是twitter,受众关注比较分散,因此点赞、转发量较少。
对比结果:Xiaomingbot在新闻资讯类平台报道,有天然的优渥土壤,这点上确实在占了一些地利。从数据上讲,Xiaomingbot胜出,但不能骄傲。
综上所述,从报道发布速度、承载信息量、可读性、播报比赛项目、能否写长文资讯和传播量等维度比较,中国选手Xiaomingbot成功为国争光,碾压了太平洋对岸的Heliograf同学。不过,在播报项目数量上还可以做得更好。
总之一句话来说,Xiaomingbot的科技相当黑了。在业内看来,Heliograf可视为第一代写稿机器人的代表,Xiaomingbot的面世则意味着机器人写稿技术已经进入到第二代写稿水平。
从用户数据来看,机器人写稿已经被天朝人民所接受。数据显示,Xiaomingbot自8月6号起开始写稿,截止8月12日11点30,已经有超过38万用户通过Xiaomingbot的报道获取赛事战报。
蓝媒汇点评:
值得注意的是,机器人写稿近一两年已得到不少应用,在Xiaomingbot之前,国内既有腾讯的Dreamwriter,第一财经的DT稿王,以及新华社的快笔小新,根据算法在第一时间自动生成稿件,瞬时输出分析和研判,极短时间内便将重要资讯和解读送达用户。不过,这些机器人多集中在财经信息领域。
越来越拟人化、智能化,也让不少媒体人发出了饭碗被抢了的担忧。但实际上,大可放心。
有业内人士表示,机器人再怎么智能,也是通过人的编程实现的,机器人所替代的工作,不过是一些能用模板、数据来替代的短平快的稿件。真正个性化的写作,比如深度报道、调查报道、人物报道等,机器人不可能替代记者的主导作用。
无论是今日头条,《华盛顿邮报》、还是腾讯等,其目的是为了将简单的比赛信息更快的发布出去,从而一方面成为记者的助手,另一方面也解放了记者,让记者和编辑去从事更具挑战和智慧的工作。
“Xiaomingbot并非想取代记者。相反,新闻机器人是记者的助手,可以帮助记者更高效的完成新闻报道工作。”头条实验室负责人李磊博士说道。Xiaomingbot最大的意义在于,面对奥运会这样同时举行上百场比赛的综合赛事,记者很难关注到每一场比赛,而机器人可以任劳任怨地为每一场比赛报道,无论这场比赛多么冷门和不重要。
在帮助记者、去做更有价值的内容,以今日头条、腾讯等在机器人写稿上的探索,未必不是一件好事。看似一些岗位的员工,的确是没饭碗了,但对提升整体媒体的业务水平,从长远来看一定是件好事。
所以,本篇稿子很有可能也是机器人自动生成的。
责任编辑:
声明:本文由入驻搜狐号的作者撰写,除搜狐官方账号外,观点仅代表作者本人,不代表搜狐立场。
今日搜狐热点发布: 9:31:00 |作者:
|来源: 智东西&&导语:在“机器写稿”商业化前夜,故事由BAT和今日头条主导。&&上周五,今日头条估值超过120亿美元的消息被刷屏。在内容市场的红海里,身价暴涨的今日头条已成为一条让BAT望而生畏的“大鱼”,寡头围剿和壮士突围间充满变数与可能,技术优势牵一发而动全身。&&一项内容市场竞争与人工智能技术结合的产物——写稿机器人,将视线聚焦在百度、阿里巴巴、腾讯、今日头条的新战役中,而逐渐起势的机器写稿产业本身也已成为战役中尤为重要的一环。&&在深入调查“机器写稿”产业的过程中,意料之外的两大既成事实让我开始重新审视人工智能和内容生产。这两件事实分别是:&&1)在垂直领域的报道中,写稿机器人已经被高频率采用;&&2)腾讯、今日头条、阿里和百度,是国内写稿机器人技术应用最早和最为成熟的平台。&&了解人工智能技术在专业领域的应用现状,能够更为直观地感受技术革命临近的前奏。更进一步,其在内容领域落地的深远意义在于,将为互联网上游资讯生产流程和数据应用方式的带来颠覆式影响。&&而在当下,这一关键阀门就掌握在BAT三巨头和估值超120亿美元的新劲敌手中。为此,智东西特采访到腾讯内容机器人项目负责人、腾讯财经副总监刘康,阿里巴巴大数据价值挖掘专家、第一财经首席数据专家汤开智博士,今日头条相关专家,行业资深人士,进一步解构这场互联网内容和数据重组的入口之争,窥探背后更大规模的文本范式生成市场。&&(注:近日有消息称百度推出了其智能写作机器人Writing-bots,但据笔者调查暂无可查证的实际应用案例,故此文中暂不做讨论。以“度秘”的赛事解说功能为参考。)&&一、 文字背后的机器人&&写稿机器人,并非指实体的机器人本身,而是将机器自动生成文本,产出内容的系统抽象化和拟人化。具体而言,写稿机器人多以特定的信息库为基础,通过一定的筛选、分析、运算等信息处理手段,将信息进行重新组合、排列,并套用事先设置好的写作模板,最终输出新闻报道。&&“机器写稿”,背后涉及数据挖掘、自然语言处理、机器学习、搜索技术、知识图谱等多项人工智能技术。套用一般的人工智能的要素模型,“特定的信息库”即支持该项技术的“大数据”,“针对文本信息的重组、排列”即为该项产品背后的核心算法。从早期的人工设定模板,到深度学习引入后的机器自我学习和模板优化,“写稿机器人”本身正在不断进化。&&机器人介入写稿最早起始于美国老牌报业《华盛顿邮报》。早在2012年年末,《华盛顿邮报》就启动了名为“truth teller(吐真者)”的实时新闻核查项目。它能全程记录新闻报道中的文字、语音等信息,随后与“打假”数据库进行对比,一旦发现异常便会发出警报。&&从2015年开始,中外媒体的“写稿机器人”走进版面,开始自立名号。《纽约时报》Blossom、《华盛顿邮报》Truth Teller、《洛杉矶时报》智能内嵌模版、《卫报》Open001、路透社的Open Calais、美联社的Wordsmith六家国际顶级媒体设立各自的机器人服务系统。&&在国内,腾讯于2015年8月率先推出Dreamwriter写稿机器人。随后的一年,今日头条xiaomingbot、第一财经DT稿王、百度度秘解说相继浮出水面。腾讯、阿里巴巴、百度、今日头条,四方割据的局面正式形成。&&在信息流市场,第一财经能够代表阿里巴巴的战略布局。在于2015年阿里的12亿元购入第一财经集团30%股权,随后也将旗下的大数据价值挖掘专家汤开智博士调任至第一财经,任其首席数据科学家,为其自动/辅助写稿产品提供技术支持。&&二、四大平台的机器人赛稿&&为呈现一个更加具象的写稿机器人市场,笔者集中体验了腾讯、今日头条、百度、第一财经四家产品在用户界面、内容呈现和出稿数量、效率等方面的表现,并对比分析各家在产品布局和应用领域的思路与特点。&&1)产品特点与应用状况&&从上述图表分析中可以看出,上述四家的“写稿机器人”产品主要还处在自研自用阶段,主要用于自家媒体平台的内容产出和分发。此外,第一财经首席数据科学家汤开智向智东西表示,旗下的DT稿王产品现还应用到电商平台“千牛”的资讯版块。&&覆盖领域以体育赛事、和财经类新闻为主,多以短、平、快的处理方式产出赛事战报、快讯等。其中腾讯在新闻内容覆盖面上最广,其产品的对接平台包括腾讯财经、腾讯科技、腾讯体育等。第一财经集团因其更强的媒体属性和广泛的产品渠道,内容分发领域更更广,包括媒体产品端、微信内容推送、电视新闻等。&&在报道形式上,赛事报道更倾向于图文结合的方式,图片采用自动匹配的模式。当然在面向不同终端和产品时,报道风格可能有所调整,比如在腾讯体育移动端中,赛事报道就是以纯文字方式呈现;而在腾讯新闻客户端,则保留了完整的图文内容。&&在产稿量方面,各家并没有给出具体数值,笔者结合页面呈现数量和参考值进行统计。腾讯因其覆盖领域最广,在有效产稿量上占据一定优势。“机器写稿的机制是大规模地写,最后用不用由人工编辑、CMS(Content Management System、内容管理系统)进行判断”,腾讯内容机器人项目负责人、腾讯财经副总监刘康介绍。&&第一财经则主要以股市异动为新闻切入点,报道更频繁。”长报道的使用频率相对低一些,最多一天一篇,或者一个月一篇”。&&需要说明的是,将只是用于“赛事解说”的百度度秘平台纳入到分析对象中,主要原因在于度秘的“实时图文内容呈现+音频播报”的产业化程度已经达到机器写稿的程度,其背后的技术原理也十分相似。或许是百度平台本身缺少媒体属性,抑或是作为内容分发平台不适合自产出内容,百度并没有在前端用新闻的形式呈现。&&2)用户界面特点分析&&以上分别是调用第一财经“7*24小时看板”、度秘APP“度秘直播篮球赛”、今日头条“Xiaomingbot”头条号作者专栏、腾讯新闻搜索“Dreamwriter”呈现的不同界面,统一以移动用户端进行比较。&&从报道形式和内容丰富程度来看,机器写稿与人类已经无异。在标题处理上,“击败雄鹿”、“创新高”、“奇才”、“遗憾”等用词已经脱离机械式的比分呈现,带有个性化的媒体报道属性。滚动式的股票类财经快讯则更强调时效性和数据准确性,在这个维度上,机器胜过人类。&&3)内容呈现特点分析&&在报道形式与风格上,各家根据用户特点进行了不同的呈现。腾讯Dreamwriter、今日头条Xiaomingbot采用图文结合得形式进行报道,Xiaomingbot在图片与现场感呈现上更为丰富,Dreamwriter则更强调比分和细节。在文章框架上,两者都对赛事亮点和整体局势进行了提炼,而不是简单的陈述数据。&&百度度秘的解说以对话框的形式呈现,能够为用户提供实时的赛事战况直播,并且配以部分动图和音频,表情和语气词的也很到位,更加拟人化和形象化。&&第一财经,作为一个更加专业和垂直领域的媒体平台。除去中文内容呈现,同时进行了英化处理,“中文财经模板很大一部分被翻译成英文模板,省去了内容翻译的成本,在一财全球使用”,汤开智博士介绍。&&总体而言,在写稿机器人这块新业务上,BAT三家与今日头条的技术和产品差距并不大。比较遗憾的是,百度并没有将其背后的技术整合出完整的媒体产品,提到度秘的“赛事直播”功能很多人并不知晓。&&究其背后的原因,可能还是百度本身缺少媒体平台基因,聚焦在用户的被动搜索与广告业务。不过,另一面,今日头条的百度化却比想象中快。&&三、外行看热闹 内行看门道&&对于一个曾经视“人工智能威胁论”为笑话的人,突然间发现,机器人已经侵入到自己所擅长的领域,内心多少有些惊讶和恐慌。不过,人工智能的更大价值还在于了解之后为人类所用。“我个人偏向中性的认知,机器写稿的确能够取代一部分人力,但只是冗余的、低技术门槛的人力”,腾讯财经副总监刘康认为。&&在与第一财经汤开智博士的交流中,他认为机器写作的研究主要围绕三种典型模式,“逻辑由浅入深,从精确到模糊”:&&1)第一类是基于数字进行事实陈述,并进行简单逻辑分析的文章,比如二级市场的监控、体育赛事的简讯;&&2)第二类是根据每类稿件的信息要点,对信息源进行针对性的信息提取,把非结构化的文本转为结构化及半结构化的数据,再根据不同的规则把信息要点组合写成单点内容;&&3)第三类是单点内容的关联生成,此类稿件能弥补单点内容信息量单一的缺点,并为受众尤其是投资者,及时关联专家对基本数据的解读及评论,生成更有深度、更立体、更综合的稿件。&&在写稿机器人产品中,背后技术支持最为明确和清晰的是今日头条的“Xiaomingbot”,它是由头条实验室与北京大学计算所(万小军团队)联合研发而成。今年2月今日头条还挖走了前微软亚洲研究院副院长马维英,担任其负责人。&&在抽取式文本生成研究领域,北大万小军老师于关于采用特征工程抽取句子的论文《Towards Constructing Sports News from Live Text Commentary》在ACL2016引起了广泛关注。今年初,万小军老师还以技术开发团队负责人的身份,帮助南方都市报完成了写稿机器人“小南”的研发。&&从产品演进路径来看,一代写稿机器人语言偏向生硬,句式较为单一。在优化后的产品中,具备更高的语言表达和逻辑思维能力,以及图文信息处理能力。以下是写稿机器人的简化版工作流程:&&“现在大家都还处于技术过渡的过程”,业内人士表述。前期产品以简单的结构化自动生成为主,将一些数据嵌入进去,利用人工模板。因为机器学习和数据库的完善,大家希望能够借助机器的自主学习功能,“比如,跑一百万篇文章,机器可以自建模板”。&&但在现实应用中,因为垂直、专业领域的文章具备鲜明特点。自然语言理解技术有局限,目前机器读取数据填充格式化模板是最成熟但也是最没有技术水平的方案,写稿机器人产品仍主要用于体育和财经类资讯 。&&体育和财经文本信息较少,数据信息多,“每周几十场NBA、足球赛、棒球赛等,以及每天全球主要市场上万家上市公司的各种披露信息和股票涨跌”,从这个角度上说,人群结构化程度较高,垂直化需求强烈。&&四、商业价值所在:以一当十五&&技术落地的最终诉求来自产业所向和商业价值。“多、快、好、省”,是腾讯财经总监刘康对于机器写稿红利的提炼。&&他并未给出写稿机器人准确的产出效益比。“一般来说,机器产出的稿件30-50%,会各个频道的采用,最终呈现在页面端”。实际上,写稿机器人的成效容易量化,基于其产出的稿件量或者字数,以量化成普通人力的规模。其核心的“快”,包含两个层面,一是响应速度,写稿机器人平均可达到1分钟甚至更快产出快讯;二是分发速度快,与后台无缝衔接,缩短至各平台中间流程。&&作为技术输出的第三方,面向B端的服务集成是另一种可循的商业模式。面向媒体企业收费,“例如某科技媒体平台一年人工费用为900万,采用自动写作或者辅助写作的产品,可以提高员工绩效和产出,减少其人力成本”,从业人士介绍,写稿机器人可以24小时在线,而人工还需要轮班和调休&&在与阿里巴巴驻第一财经首席科学家汤开智的交流中,他更为系统地介绍了写稿机器人所产生的效益提升,主要包含以下三个方面:&&1)机器稿件产量的提升。“从去年8月25日开始记录到现在,”一财全球“总共产生19604篇稿件。考虑到机器写稿的简短性,平均每篇稿子64.5字,总字数为1,264,458字, 平均每篇稿件约64.5个单词。这相当于同时期一个15人编辑团队人工监控股市写稿的总产量。&&综合分析,考虑到目前机器稿件的单调与重复等因素,稿王机器稿件的加入,相当于为一财全球增加了一个3个人的编辑团队。&&2)成本下降和资讯反应速度的提升。基于沪市1040家公司、深市1420家公司的即时监控和异动报道工作,至少需要15名以上的编辑进行即时监控,每人要同时监控100多只股票,1名翻译即时翻译。并且,股票的异动分成多种情况,人反应和分析的时间将带来5~10分钟的延迟。&&因为写稿机器人的使用,这些稿件在没有人工参与的情况下快速生成,延时也降低到1分钟。此外,写稿机器人还能针对大盘、板块进行着监控和稿件生成。&&3)流量的贡献。根据Google Analytics汇总报告中显示最近1个星期, 3月20日到3月29日之间机器稿件流量占到一财全球全部流量的25%,相对于之前有显著提升。&&五、新闻之外 更大的文本范式“蛋糕”&&利用写稿机器人的工作思路:文本分类,文本中的信息提取,文本总结,基于逻辑的自动写作方法在“文本范式”的领域,均具备可迁移的想象空间,如法律、合同、电商数据等领域。&&“电商模式是来钱比较快的”,业内资深人士分析,并提供值得借鉴的方向思路。电商数据多而庞杂,对于当下盛行的电商导购返利网站而言,UGC(用户原创内容)需要大量的人工审核,虽然编辑自己写的少,但是仍然需要花大量人力在审查上。&&机器审查又会过滤掉一些很有价值的商品推荐。所以建立一个机器写作的导购网站,UGC或者机器只要去发现一些有价值的线索就好,“具体的内容我们交给机器去写,赚流量的同时也赚眼球”。&&综合以上分析,四大平台下的写稿机器人最具商业化前景和可能性。“其平台不仅具备完善的财经数据,同时得到了阿里巴巴的电商数据支持”,前文提及的“千牛”电商平台资讯服务也得益于此。&&此外,据汤开智博士介绍,DT稿王产品的下一侧重方向在于,“为专业的内容生产方提供技术输出,建立一套辅助写作系统,能够和编辑互动”。&&“语言生成是一个非常基础的问题,我们如果可以把这个问题解决好,自然语音的理解方面可能还会有更大的突破,我们很多方法可以把难问题变简单,如果能够设计成模型自动的做这一步,最后得到的效果会更好”,今日头条科学家、实验室总监李磊表示,可以想象围绕写稿机器人衍生的系列“文本范式”算法,将成为今日头条后续的信息流源头之一。&&腾讯方面,则朝着产品化的路径进一步完善。“近期,我们会有一个更具体的产品发布。类似一个服务系统,可以用于前端展示”,腾讯财经副总监刘康向智东西。&&六、大数据时代下 高质量数据源却“一票难求”&&在本月初的IT领袖峰会上,马化腾曾提到,就算是腾讯这样规模的平台,在数据应用上仍面临难题。“用户直接产生的数据还需要脱敏(保留隐私性)、清理(保留有效数据)、加标签(分类)等前序工作后才能产生出有价值的数据”。&&机器写作需要从大量的文字资料中或许稿源信息和文本数据,然而实际上互联网上的中文信息本来质量就不高,清洗难度很大。&&此外,稿源信息清洗后需要格式化,然后通过数据调用载入模板的形式生成自动化稿件,这里面模板越精细化,效果就越好。然而实际上没有足够好的信息源来配合模板,同时,编写模板代码的工作量,事实上不小。&&以技术基础和数据库为导向。类似NBA、奥运会等大型赛事,大型媒体平台本身需要对接到一个信息数据库,详细的图文数据。“这个数据库是非常高质量的,包含有很多细节的”。但在赛事数据和股市数据之外,很难再找到这样结构化、高质量的数据库。&&此外,因为纯粹一个平面化的机器写作很难去做,一般还是要垂直行业能够做精细化,比方说棒球几只安打怎么报,每个投手或者击球手什么特点。对应到法律行业就是要了解司法体系,以及不同法律条文之间的关系,这远不是一个普通创业公司能做的事情。&&七、结语:下一个“今日头条”&&在你一次不经意的推送点击和页面浏览间,得到的信息很有可能就不再出自人类编辑之手,而是机敏、不知疲倦的写稿机器人产物。如果不是这次深度调查和数据搜集,我也不会意识到写稿机器人产业的发展与落地速度会如此之快。这一切,正在悄无声息地发生在你我身边。&&当机器人和人工智能不再依附于具象的实体,而是以一种虚拟手段侵入人类生活时,将变得更加莫测和不可控。同时,也是人类以一种更加理智和客观的态度地审视技术革命的契机。&&当新闻编辑室的资源越来越少,重复无创造性劳动力的越来越多,不难想象,在未来的新闻报道中,人工智能将取代更多的“媒体工作者”。&&回到技术应用前景。通过为信息流前端引入算法机制,今日头条坐享内容市场的技术红利。如果将这一思路引入上层级的信息流源头呢?在生产模式上进行劳动力改造和个性化匹配,势必将产生更加剧烈的化学反应。&&可以预见,人工智能所引发的信息流生产方式颠覆,将成为BAT与今日头条的下一个重要战场。一项由技术驱动的、更为核心的业务比拼。与此同时,庞大的新兴市场需求还将催生出一批可期待的技术领域创业新秀。&&但需要警惕的是,当人工智能大战晋升到寡头层面,其核心仍是一场数据大战!关注电子行业精彩资讯,关注华强资讯官方微信,精华内容抢鲜读,还有机会获赠全年杂志关注方法:添加好友→搜索“华强微电子”→关注或微信“扫一扫”二维码找到1条结果上一篇:下一篇:发表评论(已有0位网友评论)验证码:&&&&&自德州仪器(TI)DLP技术问世就成功的打破了LCD液晶投影&&&&&在“物联网”与“工业4.0”等应用浪潮涌动下,电子元器件的技&&&&&瑞萨的MCU在汽车电子领域可谓声名赫赫,其实近年来在工业、智

我要回帖

更多关于 抢鞋机器人bot下载 的文章

 

随机推荐