导语:近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。
谷歌开放语音识别API
谷歌Next云计算大会今日在美国旧金山召开。谷歌在会上发布了面向开发者的新机器学习平台,并开放语音识别的API(应用程序编程接口)。机器学习平台初期将免费提供给开发者。
谷歌母公司Alphabet董事长埃里克·施密特(Eric Schmidt)在主题演讲中表示,机器学习技术是未来(Machine Learning is Next)。谷歌机器学习负责人杰夫·迪恩(Jeff Dean)随后介绍称,随着近年来机器学习技术的逐渐成熟,谷歌正加快步伐在主要平台部署机器学习技术。除了此前战胜李世石而闻名的围棋程序AlphaGo,更有用户熟知的搜索、Youtube、Android、地图、Gmail等核心产品。
谷歌新机器学习平台将作为云服务提供给开发者,帮助他们加快开发各种商业应用。开发者可以借助谷歌已经使用的机器学习技术开发各种新产品与技术。这个新平台包括:帮助开发者用自己的数据组建机器学习模型,同时为开发者提供一个训练模型。开发者可以借助谷歌的诸多云服务工具,训练自己的机器学习模型。
今日的另一个大新闻是,谷歌开放了自己的语音识别API,即谷歌语音搜索和语音输入的支持技术。Google Cloud SPeech API一开始将免费提供,以后再进行收费。这一应用包括了80多种语言,适用于各种实时语音识别与翻译应用。
在语音识别领域,谷歌目前的主要竞争对手包括Nuance和微软。Nuance曾是苹果语音助手Siri背后的技术支持,也得到了诸多创业公司的广泛运用。但谷歌此次免费提供语音识别技术,可能会给Nuance这样的独立技术提供商带来明显冲击。按照谷歌的惯例,后期收费价格也会低于行业。
蛋君说:语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。API是一些预先定义的函数,目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力,而又无需访问源码,或理解内部工作机制的细节。
评论 (0)