原标题:「形色」专访:爆款识花软件的炼成之路 你能猜出下图是什么花吗? 在雷锋网 AI 研习社的小伙
在雷锋网 AI 研习社的小伙伴中,有人猜梅花,有人猜梨花,有人猜桃花,可惜他们都错了,答案稍后揭晓。
如果不是对植物有所研究的小伙伴,在分辨如上图这种特征相似的花时,往往会出现错误,而这时,就凸显了识花软件的作用。
打开应用商店搜索识花软件,主流的有「植物识别」、「形色识花」、「花伴侣」,这几种软件基本上都能识别常见的花朵,准确率也较高。
在知乎上,有人将几种常见识花软件进行对比,雷锋网 AI 研习社看到,形色识花的好评数很多,而微软识花相较来说准确度逊色于其他主流识花软件。(目前,「形色」所属睿琪软件凭借此次专访和赞助 CVPR 植物识别赛在雷锋网学术频道 AI 科技评论旗下数据库项目「AI 影响因子」中得分为 12。)
有人提出这样一种看法,「形色识别的准确度比较高是因为前期训练数据比较多,而微软识花识别率太低是因为训练数据少,但他们的算法相对来说比较优秀。」对于这一观点,形色表示,欢迎用户的质疑,这是一个改进的机会。他们最关注的,是用户提出自己对哪些植物识别不准确,他们会尽快修正。对于算法的优劣比较,形色说道,「归根究底,算法不是公开的,所以也很难评估谁的算法更加优秀,能直观感受到的就是识别准确率。相信前期的数据积累过程,各家一样艰难,我们能想到的方法,微软团队肯定也能想到,但形色的数据增加更快,肯定是最初,用户对于准确率就有所感知。」
目前,形色的识别正确率已经达到 98% 以上,可以识别 4000 多种植物,而内部模型已经可以识别一万多种植物。在识别准确率和植物覆盖数上,稳居市场前列。
形色的识花过程如下,将图片上传至形色 App,随后 App 将图像数据导入后端的云平台进行识别计算,平台会反馈 1~3 个识别结果,并获取识别结果的一张相似图给用户作为参考,同时也会给出识别结果的植物介绍。用户在给定的 1~3 个识别结果中,寻找与自己所见植物相同的结果后确认。
回到本文开头那张图片,形色 100% 确定这就是杏花,这一结果也完全准确。
据形色介绍,他们采用深度卷积神经网络这种机器学习方法,让计算机像人脑一样,通过自我学习,来判断怎样识别植物。在这一过程中,形色将植物数据给到引擎,引擎通过自我学习,得出一套可以通过数百层卷积神经网络的判断来识别植物的方法。
传统专家系统(Expert System)采用层层识别的方法,先对花朵进行粗略识别,再细分到具体种类,形色表示,如果采用传统的专家系统,将所有分类学的规则进行编码,需要不断修订此前的规则来完善鉴别系统的规则,数量的上限大约在 500 种,超过这个数量级,系统的工作量和数据库的承载能力都无法实现。植物的物种在全球超过 60 万,而常见的也在 4000 多种。
在识别时,上传至 App 的图片会经过预处理,包括光线调整、颜色反转、曝光度、切出关键部位,再聚焦等,并通过图片分类及物体识别技术,提高图片在场景中的鉴别准确度。这在一定程度上可以改善照片模糊、光线不好以及角度不好所造成的不良影响。
形色最初的模型相对来说比较简单,前期主要通过向各大植物论坛的植物爱好者征集花草图片与数据信息,还会拍照搜集杭州本地常见花卉的图片并请专家鉴定结果。他们表示,当时数据不多,识别准确率能达到 40%,彼时已经比百度的图片搜索要准确。
「最初版本的人工智能,其实是『人工+智能』,当时为了避免因为数据不足而产生的识别错误,我们还在后台配备了人工解答问题。」
人在识别植物时,如果此前见得比较少,容易出现识别错误,计算机也一样,只有更多的数据才能将准确率提升得更高。随着用户的增加,数据的积累,模型的更新,系统的识别能力也会逐步提高并且越来越精准。
在利用用户上传的数据不断优化模型时,一般情况下,用户提供的图片有很多达不到训练标准,可能出现模糊或者标签不准确的情况,形色会请专业人士先对这些数据进行清洗标注,以保证用来训练引擎的数据绝对准确。
形色表示,在某种程度上,计算机可以看到很多人眼无法辨识的特征。比如梅花和杏花,可能人眼会觉得很像,但是在深度卷积神经网络的分析下,可能颜色、花瓣形状、花瓣的纹路都有不同,从而可以准确的区分植物种类,这就是人工智能的强大之处。
一是数据标注清洗的工作量巨大,目前形色的植物数据已经超过 2 亿张,这些数据的清洗标注,十分费时费力的。
二是成本高昂,因为植物数据清洗标注对专业性要求非常高,处理人员一定要是植物相关专业,能够准确识别这些植物。形色在这方面也投入了巨大的成本。
2.0 版本,加入植物地图功能。据形色介绍,这一功能是他们首创,受到很多用户喜欢。「相信每个人都很喜欢身处花海的感觉,打开形色就可以感受到,自己身边有这么多花花草草。」
3.8 版本,加入果蔬识别功能。「这是一个里程碑功能,是形色在识别品类上的突破。用户不仅可以用形色识别植物,还可以识别水果蔬菜,了解水果蔬菜的营养价值、选购技巧、趣闻等。」
目前,形色还具备定位功能,他们对雷锋网 AI 研习社表示,由于植物具有很强的地域性,不同地区的植物差异较大,地理位置会帮助进一步准确识别植物种类。
他们和中国自然标本馆(CFH)、上海辰山植物园、浙大生物多样性研究院都有合作,这些机构在专业上给了形色很多指导意见和帮助,形色表示,专家们的意见对于提升他们的专业性和准确性很有帮助。
现在,形色 App 已经入驻上百万植物专家和植物爱好者,当系统碰到实在无法鉴别的植物,用户可以直接上传到鉴定区,植物专家和爱好者会在几分钟内给出他们的答案。
在将照片上传至形色 App 之后,只需 1 秒,就能反馈植物的名字和故事。形色表示,团队希望以最快的速度给用户最准确的识别结果,这毋庸置疑。未来,随着硬件和技术的升级,团队也会尽可能投入更多资金,研发更先进、更复杂的模型去提升识别准确率和速度,给用户最好的体验。
除了中国版,形色也推出海外版识花软件 PictureThis,对于推出海外版的原因,形色对雷锋网 AI 研习社如是说道,「一方面,全球化是目前软件发展的趋势,软件做大后肯定要走向更广阔的市场;另一方面,我们发现其实海外植物识别领域也是相对空白的。其实外国人对于植物花卉的热情更高,很多家庭都有自己的花园,但海外市场上的大多软件识别种类有限,识别准确率也不高,所以这对 PictureThis 是个很好的机会。」
目前形色的竞品很多,如「植物识别—拍照识花草树木」、「微软识花」、「花伴侣」,如何在这些软件中不落下风?
形色表示,他们一直以来,都坚持用户的想法最重要,所以更关注用户,花了很多时间去了解用户的真实需求。了解用户需求后,团队会头脑风暴、尝试探索,因此他们原创了很多功能,这也是形色的竞争力之一。
未来,他们会进一步进军海外市场,推出更多语言版本的形色,让世界各地的人们都能享受人工智能带来的便捷和乐趣。各位小伙伴也可以即刻体验形色带来的识花乐趣。