近年の技術の発展により、画像認識技術はますます身近になっています。スマホの顔認証やオンライン会議での人物と背景を認識して背景をぼかすなどをはじめ、画像認識技術ははさまざまな場面において人々の生活をサポートしています。本書では画像認識について実践的に学べるように、Pythonを使った実装を示しています。また画像認識の基礎については簡単に触れるにとどめ、最新の画像認識手法について紙幅を割き、多くの部分で深層学習の実装について学ぶことができる構成になっています。
(C) 2023 Masato Tamura, Katsuyuki Nakamura. All rights reserved.
各3,850円 (税込)
「音声認識」とは、音声信号から発話内容を認識することで、AIスピーカなどに利用されている技術です。本書は、現在までの音声認識技術の発展経緯を学びながら、深層学習を用いた最新の音声認識システムを実装できるようになることを目的としています。まず手法の目的やアルゴリズムの概要を解説し、続いて数式レベルでの詳説、最後にソースコード付きで実装という流れで解説しています。特に手法の概要については「そもそもその手法は何を目的として生み出されたのか」という経緯と、「なぜその手法は前述の目的を達成できるのか」について直感的に理解できるよう工夫しています。本書は中級者以上に向けた、特定の技術分野のアルゴリズムの紹介と、それを実装したコードを解説する、より技術的・実践的な「機械学習実践シリーズ」です。
「音声合成」とは、人間の音声を人工的に作り出す、音声情報処理の一分野です。深層学習の発展に従い、画像認識・音声認識などの分野と同様に、音声合成においてもパラダイムシフトが起きています。本書では、従来の統計的音声合成システムの基礎について解説した上で、深層学習技術による近年の音声合成の発展について詳説しています。また、実際に公開されているデータセットを用いて、深層学習を用いた音声合成システムを作るための実装の解説も行っています。本書は、2020年8月24日刊の『Pythonで学ぶ音源分離』、2021年5月20日刊の『Pythonで学ぶ音声認識』に続く、特定の技術分野のアルゴリズムの紹介と、そのアルゴリズムを実装したコードを解説する、より技術的・実践的な「機械学習実践シリーズ」の3冊目です。中級者以上向け。
近年の技術の発展により、画像認識技術はますます身近になっています。スマホの顔認証やオンライン会議での人物と背景を認識して背景をぼかすなどをはじめ、画像認識技術ははさまざまな場面において人々の生活をサポートしています。本書では画像認識について実践的に学べるように、Pythonを使った実装を示しています。また画像認識の基礎については簡単に触れるにとどめ、最新の画像認識手法について紙幅を割き、多くの部分で深層学習の実装について学ぶことができる構成になっています。
付与コインの内訳
1,785コイン
会員ランク(今月ランクなし)
1%
初回50%コイン還元 会員登録から30日以内の初回購入に限り、合計金額(税抜)から50%コイン還元適用
複数商品の購入で付与コイン数に変動があります。
会員ランクの付与率は購入処理完了時の会員ランクに基づきます。
そのため、現在表示中の付与率から変わる場合があります。
【クーポンの利用について】
クーポン適用後の金額(税抜)に対し初回50%コイン還元分のコインが付与されます。
詳しくは決済ページにてご確認ください。