人工智能背后的标注--息息

发布时间:2018-09-04 作者:jason

大家都知道人工智能应用都是需要监督学习,和庞大语料数据进行训练的。对于一般人工智能应用公司来讲,如果说要让应用落地需要的人力物力数据量都是非常非常庞大的,如果需要必定会有一个岗位出现,那就是数据标注员,说白了就是把数据正确的处理分类就是数据员的职责,对于一般公司而言如果说,没有足够多的人力专项开发软件来处理数据,那他只要外包给数据处理公司了。

  现目前业界人工智能的应用中,大部分数据需要有效正确的处理,才能创造出价值。数据标注员就是人工智能的导师,是标注员给予标注正确的语料,给予优质的内容,才能够在人工智能应用中凸显优势。人工智能数据标注员一个熟悉又陌生的词汇,其实这个并不陌生,国内人工智能公司都是有涉及的,可以举个例子你,科大讯飞在早期做语音识别的时候,就召集高校诸多应届实习生做标注员,上千人招募,日积月累的沉淀才有了科大讯飞今天的领先。

   在行业中有了需求,就会创造商机,随着人工智能企业的应用需求,数据需求不断的扩展,也衍生出了不少企业,为之提供外包服务。国内的数据提供公司(api)都在逐步寻求转型,为人工智能公司提供数据定制,数据标注,数据筛选等工作。已经转型和创业公司有:数据堂、泛函科技、来打标、荟萃数据、阿里标注、京东标注等,如雨后春笋一般,群生逐长。人工智能在起步比较早的互联网公司应用标注,都是以娱乐应用话进行操作的。腾讯的空间人名标注,科大讯飞的方言娱乐活动,都是降低标注的成本,也能让标注质量提升起来。这些标注都是需要数据的,科大讯飞的数据来源于免费限量的语音识别,腾讯、阿里的来源于已有的社交用户数据,商品信息数据。

   人工智能的发展与创新延续,都离不开背后默默辛勤标注数据的人们,标注员好比导师,引导人工智能倾向正确的方向发展,倾向正确的功能上延续。无监督学习的人工智能,前期务必是需要大量人工来完成的,后续数据逐步迭代会慢慢减轻工作直至退出标注有无监督学习。

息息.AI生活.更简单 xixi生活

©2016-2018 成都轻雨科技有限公司 Made in chengdu

蜀ICP备 17039669号-1

更多ai生活 请关注息息公众号