音声認識の精度が人間を「超えた」?

microsoft-logo

Microsoftが開発している音声認識技術の精度が向上し、その精度が人間を超えたというニュースがありました。

どういう事だってばよ?

え?人間を超えるって何ぞや?と、つい思ってしまいましたがこういう事だそうです。

 米Microsoftは18日(現地時間)、同社の人工知能研究チームが開発したシステムによる音声認識技術の精度が人間を超えたと発表した。

米Microsoftは18日(現地時間)、同社の人工知能研究チームが開発したシステムによる音声認識技術の精度が人間を超えたと発表した。

Microsoftは、「Computational Network Toolkit」(CNTK)という名称の深層学習(ディープラーニング)システムを開発し、GitHubにてオープンソースライセンスで公開している。今回のシステムもこれを利用したもので、先月まで6.3%だった単語誤認率を5.9%にまで引き下げ、機械による音声認識の記録を更新するとともに、人間のプロの筆写家の精度を超えた。

By dion gillard急激に進化を続けているコンピューターの認知能力が、新たなマイルストーンに到達しています。Microsoftで人工知能(AI)の研究を行う研究チームにより開発された音

発表によると、MicrosoftでAIを活用した製品やサービスの開発を目的とする部門「Microsoft AI and Research Group」の研究グループが開発した音声認識システムは、与えられた人間の音声を誤認識率5.9%の精度で認識することが可能とのこと。これは、話した内容を文字に書き起こす「文字起こし」を仕事とする人間と同等あるいはわずかに上回る精度となっているそうです。

なるほどなるほど。音声を書き起こしする様な方の単語認識率より優れた、もしくは同等くらいのレベルの認識率にまで進歩したという事ですね。こいつぁ凄いなーと思う反面、「文字起こし」を生業とされている方々には商売敵もいいとこだなーとも思ってみたりw

ニホンゴ、ムツカシイネー。

とはいえ、

非常に高い認識率に達したといえるMicrosoftの音声認識技術ですが、やはりまだまだ誤認識が発生するケースも残されています。たとえば「Have」という単語を「is」と間違って認識するケースもあるとのこと。ただしこれは人間が聞き取った際にも同じレベルで聞き間違いが発生しているようで、「誤認識」というよりも元の話し方に起因するともいえる模様。

gigazine.net

という事であったり

今後は、騒音がある環境下での認識精度向上、異なる話者に対して自動的に名前を付ける機能、訛りのある発音への対応などの拡張を行なうほか、単に聞き取るだけでなく、その言葉の持つ意味を理解するステージへと研究を進めていくとしている。

pc.watch.impress

などなど細かいニュアンス訛りなどなど改善点もまだまだありそうですので、当分の間「文字起こし」の方々が食いっぱぐれる心配は無さそうですね。日本語なんかも特に難しい言語のひとつという話も聞きますし。

赤巻紙、青巻紙、

きみゃきぎゃみ!!

・・・とあまりにベタすぎるくらい滑舌が宜しくない私。てかもう「かつぜつ」すらまともに言えるか怪しい今日この頃。嫁と会話してても「何言ってるかわかんない」とバッサリ切り捨てられる事も多々ありますので、私がこの音声認識システムに言葉を吹き込んだあかつきには誤認識率33.4%くらいまで跳ね上がりそうな予感がビンビンします。

母さん、父さん、僕はそれでも毎日を強く生きていこうと思います。

スポンサーリンク
レクタングル(大)
レクタングル(大)

シェアする

  • このエントリーをはてなブックマークに追加

フォローする