本周,美联社(AP)发布消息,宣称将运用一款名为“语言大师”(Wordsmith)的软件自动撰写最新高校体育新闻。此款软件由北卡罗来纳州达勒姆市(Durham, North Carolina)的自动视野公司(Automated Insights)研发而成。 不久前,主要的新闻机构纷纷转向依靠计算机程式编写新闻内容。美联社目前已参股自动视野公司,并将“语言大师”运用于写作公司季度收益报告。与此同时,在自动化写作领域,竞争者如雨后春笋般纷纷涌现。美国叙事科学公司(Narrative Science)也向诸如《财富》(Fortune)、《十大网络》(Big Ten Network)等新闻杂志提供类似服务。而在去年的洛杉矶地震中,《洛杉矶时报》的一名记者运用定制软件在震后几分钟内就自动生成了一篇实时报道。 尽管当前自动化写作的发展如火如荼,仍然有一个问题摆在我们面前:真的会有人阅读这些计算机软件自动生成的文章吗?自动视野公司CEO罗比·艾伦(Robbie Allen)回应说这一顾虑显得有些多余。虽然公司仅2014当年产生的文章数量就超过十亿篇,但这些长篇大论多数并不面向广大读者。与此相反,语言大师相当于一个私人数据管家,它对大量或许不经意间就漏过的数据进行筛选分析,最后生成通常针对个体的定制报告。 在梦幻橄榄球赛季(Fantasy Football),自动视野公司每天都为数百万的雅虎用户制定当日赛况总结。此外,自动视野还替各公司将令人头昏脑涨的数据表格转化成简明易读的报告单。或许在未来,人们甚至可以拥有自己专属的机器人记者,每日呈上为个人特别定制的健康报告和财务情况汇报。 “语言大师”的创建 简要而言,“语言大师”共需完成两样工作。首先,它接收大量结构化数据[2],并分析出其中的有趣要点。比如某场比赛中,某个选手的表现不尽如人意。接着,它将分析得出的这些有趣观点编织成一篇通俗易懂的文章。你也可以将它看作超高级版本的“疯狂填词”,因为这同样需要在同时理解数据和文字的基础上进行创作。 八年前,当时还是思科公司(Cisco)工程师的艾伦冒出了研发“语言大师”的念头。当时他已出版了十本著作,希望能发明一些新鲜事物。最终,他决定将自己对计算机、写作和体育分析的热爱结合起来,一举创办了数文公司(Statsheet)。“我对招聘大量写手的传统做法不感兴趣,”艾伦表示,“体育简讯最让人激动的地方就在于你90%的工作都在和数字打交道。” 不久之后,艾伦意识到他的这个创意并不仅限于体育,还能推广到涉及定量数据的各个领域。因此,他将数文公司更名为自动视野公司,并随之将这一技术广泛应用于包括财政金融、医疗保健和新闻业在内的各个行业当中。 一切不言而喻 目前,“语言大师”还只能处理结构化的定量数据,即那些储存于格式完好的电子表格或数据库中的数据。对此,艾伦表示,通过压缩冗长文章、二次编辑新闻稿、筛选非结构化文本中的观点等途径,其他公司完全可以在自动化写作软件研发方面走得更远。但就自动视野公司自身而言,艾伦担心这些会让公司在不久的将来偏离其定量数据分析的轨道。 上月,自动视野公司由美国私募股权投资公司Vista Equity Partners收购。艾伦透露,通过与Vista Equity Partners旗下其他公司合作,自动视野公司将忙于多种业务的展开。“对我们而言,一切似乎都是不言而喻的,”他说,“在结构化数据领域,我们面前摆着无数机会,那么我们为什么要去那些人们已争夺多年的领域抢占地盘呢?” 与此同时,我们要做的就是耐心等待在内容定制方面越来越专属的机器人记者的出现:你,只是为你。 |