C02:文娱时评
 
前一天  后一天

数字版首页 > 第C02:文娱时评
上一篇  下一篇

人工智能只能写出套路

2016年11月29日 星期二 新京报
分享:

  【技术层面】

  诸如小说之类的作品,归根结底,是艺术作品,其背后隐藏了作者的价值观、想象力、表达力,是基于大数据进行写作的机器人无法替代的。

  近日,古装剧《锦绣未央》原作涉嫌“抄袭”的争议,再次将人们的目光转向人工智能。认为其抄袭的志愿者经过三年时间的整理比对,发现这部294章的小说,仅有9章为原创,其余章节涉嫌言情、科幻、历史等219部书目的抄袭。基于此,志愿者推测应该是通过“写作软件”完成。

  这样的“写作软件”自2012年就已经出现,在某电子购物平台上搜索相应的关键词,就可以找到大量价格不同的产品。这些“写作软件”的原理很简单,就是基于已有的模板,进行内容填充,背后依托的是大量小说、历史、科幻等著作收集而来的数据。

  这与现在的机器人新闻写作相似。许多新闻报道,从内容构思、素材采集以及文章的组织整理、结构处理等,都有基本的模式或规则可循。所以通过采集大量各类题材以形成高质量的、庞大的数据库,再通过大数据进行分析,从中寻找到模型、规则以及相互关系等,就可以实现自动生产。

  用现在的话说,都是套路。只要有套路,就有机器人、算法的用武之地。所以,当美联社、华盛顿邮报、腾讯网、新华社等用机器人进行财经类、体育赛事的新闻撰写,就没什么好大惊小怪的。

  不过,这样的方式离真正的文学创作还有很远的距离。用机器生成小说、创作电影或剧本,属于自然语言生成技术的范围。一般而言,需要解决两个方面的问题,一个是说什么,一个是怎么说。前者决定故事的梗概或布局,后者则是语言的表达。上述“写作软件”或新闻写作算法,属于后者——只要数据足够庞大,机器人通过深度学习、训练,就可以达到与人类语言接近的表达水平。

  但对于前者,目前仍然没有好的解决方法,仍然要基于模板、规则再加人工干预的方式实现。

  诸如小说,归根结底,是艺术作品,其背后隐藏了作者的价值观、想象力、表达力、世界观。这是目前基于大数据、算法来进行写作的机器人所无法替代的。

  韦彬(智库研究员)

更多详细新闻请浏览新京报网 www.bjnews.com.cn