热门问题
时间线
聊天
视角

Mycroft

使用自然語言使用者介面的語音助理 来自维基百科,自由的百科全书

Remove ads

Mycroft是一个自由与开放原始码的语音助理,其使用自然语言的使用者介面[3][4][5]。其程式码原先使用Copyleft的授权条款,但后来改用宽松自由软体授权条款[2]。其以1966年的科幻小说《严厉的月亮》中的一台虚构电脑为名[6]

事实速览 开发者, 当前版本 ...

历史

当Ryan Sipes与Joshua Montgomery造访堪萨斯的骇客空间时,他们看到了一个简单而基本的智慧虚拟助手专案,这为Mycroft带来了灵感。他们对这项技术感兴趣,但觉得它不够灵活[7][8]。Montgomery认为,迅速发展的智慧个人助理产业会为使用者带来隐私问题,并承诺Mycroft将会利用其开放原始码的机器学习平台来保护隐私[9]

Mycroft赢得了多项大奖,其中包含了2016年著名的Techweek之KC Launch竞赛[10]。Mycroft也参加了堪萨斯的2016年Sprint Accelerator,并在2017年2月加入了500 Startups的Batch 20[11][12]。该公司同时也接受了捷豹路虎的战略投资[13]。到目前为止,该公司已从机构投资者处筹集了超过250万美元,并选择透过股权群众募资平台Startengine向大众发售公司股票[14]

Remove ads

软体

Mycroft语音堆叠

Mycroft将语音堆叠的很大一部份以自由软件的型式提供。

唤醒词

Mycroft透过其Precise唤醒词引擎实作了唤醒词定位,其又称为关键字定位[15]。在Precise成为预设的唤醒词引擎之前,Mycroft使用PocketSphinx。Precise并非以音位识别为基础,而是使用经过训练的循环神经网络来识别哪些声音是唤醒词,哪些又不是。

文字转语音

Mycroft正与Mozilla的Common Voice专案合作以将其DeepSpeech用于语音识别软体[16]

意图解析

Mycroft使用名为Adapt的意图解析器将自然语言转换为机读数据结构。Adapt透过在语音中按顺序寻找特定关键字来进行意图分析。他们还有另一个解析器,Padatious。而Padatious则是使用以范例为基础的推理来确定意图。

文字转语音

语音合成方面,Mycroft使用以Festival Lite语音合成系统为基础的Mimic[17]

模组化设计与互操作性

Mycroft的设计相当模组化,因此使用者可以更换其组件。举例来说,Mimic可以使用espeak代替[18][19][20][21]

硬体

Thumb
Mycroft Mark I的外型

Mycroft专案也正在研究并销售执行其软体的智慧喇叭。它的所有硬体都是开放原始码的,以CERN开放硬体授权条款英语CERN Open Hardware Licence[22]释出。

其第一个硬体专案为Mark I,主要是针对开发者发行。其生产由Kickstarter上的活动提供了部份资金,活动也顺利完成。装置于2016年4月开始出货[23]

其较新的硬体专案为Mark II,则是提供给大众使用,而非仅针对开发者。与Mark I不同的是,Mark II配备了萤幕,能同时利用视觉与听觉传递讯息。与Mark I类似,Mark II的生产透过Kickstarter筹措部份资金,活动于2018年2月结束,筹措到的资金几乎是原始目标的8倍。但截至2020年4月,Mark II仍未交付给提供资金的人[24]

Mycroft也宣布第三个硬体专案,Mark III,将会透过透过Kickstarter提供,原先预期会在2019年11月将Mark I、II与III释出到商店,但因Mark II的延迟而未确定释出时间[14]

合作伙伴

Mycroft已经进行了几项商业合作。2018年5月,该公司与社会企业WorkAround合作(后者为难民提供工作机会)以进行大量的机器学习训练[25]。2018年10月,Mycroft与疾病监控与预测公司SickWeather合作识别由密苏里州堪萨斯城资助的大众运输工具上咳嗽的频率[26]

参见

参考资料

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads