AIの時代背景からさかのぼり、技術の進化の過程をまとめてきました。
AIと括られると人は不安や思考停止に陥るがシンプルにひも解きます。「画像認識編」
AI進化の大本命に迫るけど・・難しい?そこを簡潔に「ディープラーニング編」
その中でも、今では一般的にはなってきており見過ごされ気味ですが
近年の「音声認識、文書理解」の進化は素晴らしいです。
この「音声認識、文書理解」についてググればいっぱい出てきますが
かみ砕いてレポートします。
「音声認識、文書理解」の進化
先ずは、もう皆さんが普通に使っている事例から
「音声認識」
・Hey Sri タイマー3分セットして
・OK Google 明日の天気教えて
・アレクサ 夏にピッタリのBGM演奏して
「文書理解」
・Amazonや楽天での「これを買った人はこれも買っています」*レコメンド
・Google、Yahooで検索ワードを入力すると「もしかしてこれですか?」
・外国語翻訳
レコメンドとはオンラインショップなどで、利用者の好みにあった物品やサービスを推薦する手法。 利用者の購入履歴やアンケート、好みが似た他の利用者の情報を分析し、適切な物品やサービスを絞り込んで推薦することにより、売り上げを高めるのがねらい。
先ず「文書理解」この進化は目まぐるしいですよね。
一番の功労者は検索サイト「Google、Yahoo」です。
世界規模で毎日数億人がネット検索している事でしょう。
そうなんです、世界中の人が情報入力を自ら無償で行っています。
「入力情報」「紐づけられた情報」 ⇒ 「ビッグデータ」
「誤入力」「もしかしてこれ?」「間違いに気づき入力」⇒あいまい検索の精度が上がります
その結果、今までは単語変換のみであったものが前後の文字を判断し「文節変換」の精度も上がっております。
これが「構文解析」に当たります。
この様に、単語を瞬時に「主語、動詞、述語、接続語、方言」を見極め「構文解析」で
文章を理解するロジックが「文書理解」となります。
世界中の人々と一緒に私自身が情報工作員と言う事になります。
検索エンジン恐るべしです・・
この環境が出来ると次は「音声認識」です。
これは中身の難しい音声波形技術やマイク精度技術の向上なので置いておき
世界各国の人の声を瞬時に見極め、文字おこしをする技術です。
「OK Google 明日の天気教えて」
「OK Google」でスイッチオン
「明日の天気教えて」⇒「明日」「の」「天気」「教えて」に分解し文字おこして「構文解析」
「構文解析」結果の文字「明日の天気教えて」でGoogle検索
続いて、検索結果の文字を「音声変換」
「音声変換」文字を読み上げて回答
この様なロジックで成り立ちます。
シンプルですが裏では莫大な「ビックデータ」と高速な処理コンピュータで判断しています。
この恩恵に預かる我々が日々大量なデータを提供しているというモデルです。
後付けなので何とでも言えますが、この仕組みを具現化した企業はやはり最強です。
「GAFA」が一大勢力なのもうなづけますね。
GAFAとはグーグル(Google)、アップル(Apple)、フェースブック(Facebook)、アマゾン(Amazon)の4社のこと。いずれも米国を代表するIT企業