Java语音识别

有没有人有任何开源的经验,或相对便宜的语音识别API的Java? 我非常想找一些能把说出来的单词变成文字的东西。

从Sun的Java语音识别页面看来,这似乎是一个相当死亡的东西。 我的要求是至less在Linux上运行的东西。

谁能推荐一些东西? 纯Java将是一个奖金,否则基于Linux的解决scheme可以考虑。 因为这是一个家庭项目…越便宜越好。

  • 编辑

CMU狮身人面像As Amit指出CMU狮身人面像http://cmusphinx.sourceforge.net/html/cmusphinx.php我的问题是一个巨大的字错误率。 培训本身就像一个项目,我希望能在这个周末有所收获。

IBM ViaVoice
“ Via Voice”开放源代码在2004年有消息公布。 新闻发布似乎不成熟,而且从未发生。 威盛语音是在某个时候发布的Linux ,但似乎他们停了下来。 似乎在IBM网站上留下的所有内容都是ViaVoiceembedded式的 。

IBM Websphere Voice
我想这就是为什么ViaVoice(桌面)似乎停止。 IBM创build了这个商业解决scheme,这个解决scheme将花费更多的成本。 而使用它将会把你剩下的,至less在我的websphere和他们的IDE的经验之后。

Nuance的
看来他们仍然可能为linux创build产品。 但是我认为他们迷了路,并且跟随IBM进入了服务器市场。 我不太确定这个,他们的网站在寻找有用的信息方面并不友善。

开放的心灵/言论自由
这些人不断改变他们的项目名称。 可能有些钱饥饿的公司一直在威胁他们,但我不知道。 该项目看起来有点死。

我可能会尝试在这周末训练狮身人面像,看看它是否想成为朋友。 否则,更糟糕的情况是,我会考虑使用微软的语音解决scheme。 它在过去一直很好,但它不是一个好的Linux解决scheme。 我可以通过酒来使用它,但是我会有两个独立的服务器…凌乱的凌乱。

哦,什么似乎是一个很好的地方访问语音/语音SpeechTechMag 。 他们有一个“Anual Reference”,其中包含一些与语音/语音有关的公司名单。

Solutions Collecting From Web of "Java语音识别"

主要是Java: http : //cmusphinx.sourceforge.net/html/cmusphinx.php

如果你是一个预算,狮身人面像是迄今为止最好的选择。 然而,它也会对您使用的模型,调音方式以及调音方式产生巨大的影响 。 绝对一切都必须匹配否则它不会工作。 鉴于你所描述的问题,你愿意打赌一大笔钱,你有你的模型混合起来,你的麦克风没有正确校准。 另外,如果你有一个口音,它可能不会工作 – 这是解码器,但与声学模型不是一个问题 – 如果没有一个人的语音/口音类似于你的训练数据,你会得到不好的结果。

那么说,你有没有看过他们的开源模型页面?

http://www.speech.cs.cmu.edu/sphinx/models/

取决于你正在做什么,你应该能够获得大约90%的自由言论准确性与16kHz的WSJ模型和千兆LMs NVP。 然而,我谨慎的说,ASR是一项庞大的事业,尚未达到商品地位。

您可以从http://www.basic-signalprocessing.com下载vPass(语音密码)。

对于(vText)语音到文本,我可以将vText.jar文件发送到您的电子邮件。 请通知enquiry@basic-signalprocessing.com

这些组件是为Java和.Net语言设计的。 识别时间是5秒。 VPass已经很好的测试了vText不是,还是新的,这就是为什么还没有打包。

问候,安德烈亚斯

我几天来一直在寻找同样的东西。 到目前为止,我已经找到了Sphinx4和FreeTTS。 两者都是java实现,Sphinx看起来像FreeTTS更新频率相当高。 我遇到的唯一问题是狮身人面像在办公环境中遇到问题,我需要仓库环境的解决方案。

我的小组用Java完成了一个小程序,用Sphinx识别口头数字。