邹哥亮:
到目前为止,FirePhone是唯一能够满足我对“智能”的有限想像的智能手机。(多图)
这里以我有限的见识描述下Firefly识别功能:
1、Firefly所能识别的项目
A.Textrecognizers:泛指图像文本识别(ImageTextRecognizer),有别于OCR(OpticalCharacterRecognition),而是类似名片识别,拍照翻译等功能,其终极问题是Google’sNewStreetViewImageRecognitionAlgorithmCanBeatMostCAPTCHAs
B.Audiorecognizers:音频识别,如歌曲识别(这一领域的先驱Shazam使用户可以在任何地方通过歌曲的任何一个音轨对其进行识别),电视节目识别等;
C.Imagerecognizers:图像识别,主要是基于内容的图像搜索(ContentBasedImageRetrival),更近一步讲是类似重复图片检测(Near-duplicateImageDetection),只要是数据库中存在的样本图像,只要查询图片是对其的重采样或编辑,总是可以找到原样本图片,这样就给人造成可以识别上亿商品的表象,说白了就是一对一的匹配,而非广义的图像识别。
这三项与小李子在KDD2012开幕式上演讲提到的九个需要解决的计算机问题的前三个OCR、语音识别、图像搜索(NineRealHardProblemsWe’dLikeYoutoSolve[Abstract,Slides:PDF])[4]不谋(也可能是有谋)而合,尽管有所出入,但大抵是这个意思。可咱贝爷已经实现了,而且意指很明显,肯定能用它赚上钱,小李子你在忙啥,忙着跟Ng秀基情么?
文本识别和音频识别相对来讲识别对象明确些,且小生对这两块了解有限,接下来只讲图像识别这块,这边的战斗更多彩,摄像头做为移动设备的入口之一,早已成为兵家必争之地。
2、摄像头后面的头
烧不起器材的穷吊经常用“摄影不在于镜头多牛,而在于镜头后面的头”解毒,这里我替贝爷喝句\
本文来自“玖玖言”用户投稿,该文观点仅代表作者本人,不代表华夏信息网立场,本站不对文章中的任何观点负责,内容版权归原作者所有、内容只用于提供信息阅读,无任何商业用途。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站(文章、内容、图片、音频、视频)有涉嫌抄袭侵权/违法违规的内容,请发送邮件至1470280261#qq.com举报,一经查实,本站将立刻删除、维护您的正当权益。如若转载,请注明出处:http://www.xxxwhg.com/zh/102056.html