統計・機械学習を用いて世の中のわりとどうでも良い問題を検証します.
SIGNICO は10/8(月)に池袋サンシャインシティで行われる技術書典5にて,新刊"SIGNICO vol.6"と今までの既刊を頒布します.
画像生成の技術は日々進歩しており,生成される画像のクオリティは飛躍的に向上している.本稿では高精細な画像生成技術であるPGGANを用いてpix2pixを実装することで高精細な画像変換を目指す.
人の顔に対する画像処理は需要がとてもあるようで、様々な画像処理の分野でも最も発展しているものの一つである.顔認識を利用して、写真内の人の顔を入れ替えるアプリなども出現している.本稿ではGANの技術を用いてこの"顔交換"を実現してみる.
競技プログラミングのコードはたくさんの人間が同じ問題を解いているので学習データにできないだろうか,あわよくばそのコードのどこがどれくらい間違っているかの評価ができないか,という取り組み.
近年の画像生成技術の発展によって,我々は好みの嫁画像生成に近づいてきている.しかしヲタクの業は深いもので,嫁の画像が生成できれば次は動かしたくなるというのが性である.本稿では,任意の入力画像に好きなポーズを取らせるための手法を実装する.
本稿では,音声のパラレルデータ(対応関係のあるデータ)を必要としないCycleGANという手法を使って声質変換する実験を行う.本手法では声質変換を,音韻性を重視した低次元音響特徴量の変換と,話者性を重視したスペクトログラムの高精細化の二段階に分ける.低次元音響特徴量の変換では,CycleGANを用いて学習する.スペクトログラムの高精細化では,pix2pixを用いて学習する.これらの変換で用いるニューラルネットワークは全て畳込み層のみから構成されており,リアルタイムで声質変換することができる.
オタク機械学習において学習データは著作物であることが多く,データのラベル付けが研究者の間で非常に苦痛の作業となっている事実がある(私感).本稿では,識別問題において訓練データのラベル付けのコストを削減する技術であるActive Learningと,そのベイズ的発展であるBayesian Active Learningを紹介する.加えて,ベイズ的な深層学習モデルであるBayesian Neural Networkの手法についても紹介し,実装のコストや精度についても言及する.Bayesian Neural Network入門記事みたいになってたらいいなぁ.
ヲタクの情熱によって嫁画像生成はここ数年で圧倒的な進化を遂げた.その中で我々は,pipで一行でインストールでき,以下の三行で無限に嫁画像が生成される,もっとも手軽なライブラリを提案する.
from chainer_progressive_gan import KawaiiGenerator
for image in KawaiiGenerator():
image.show()
イラストの色特徴を他のイラストに転写したい.本実験では,GANを用いて色特徴ベクトルが線画とマッチするか判別することで,転写可能な色特徴空間を得る手法を提案する.
近年画像生成の研究が盛んに行われているが,実用性を考えると,完全自動生成ではなく製作者の意図を反映した画像生成を行いたい.本稿では,入力する意図として,ポーズを用いることで,自分の好きなポーズの画像を生成する.また,自分の写真からポーズを転写することで他人になりきる実験の基礎的検討を行う.
広く利用されている画像圧縮フォーマットである JPEG, JPEG 2000 や H.265 の画面内予測手法を元にした BPG よりも ファイルサイズあたりの画質を上回る圧縮手法が提案された. 一般的な画像圧縮フォーマットが用いる係数変換, 量子化, 算術符号化などの手続きを踏襲しつつも GAN などの仕組みを利用して特徴の抽出, 再構成画像の画質向上などが行われている. 本稿では提案された手法の簡易的な実装およびその解説を行う.
近い将来,我々の姿を二次元に投射する技術が必要になるだろう.本報告では深層学習を用いて実写画像をアニメ画像に変換するモデルを提案する.対応関係のある実写画像とアニメ画像のデータセットは数が少ないため,対応関係のない画像を活用して画像変換の学習を行うが,この際,二種の画像ドメイン空間の対応関係を何らかの手法で得る必要がある.本報告では画像の形や色が近い空間は対応関係があると仮定し,対応関係のない実写画像とアニメ画像データセットを用いて画像変換を学習した例を示す.
我々には,かわいい画像をかわいさをなるべく保ったまま絵文字にしたいという欲求がある.本稿ではそれを機械学習によってサポートする.絵文字やドット絵を作るためには単に画像を縮小すればよいというものではなく,限られたピクセル数でなるべく元の絵のディティールを保った変換が必要である.本稿では,補助問題として超解像度画像生成を利用することで,逆の問題であるドット絵生成を実現する.
近年,金髪の人気が高まっていることが知られている(筆者調べ).本稿ではSIGNICO vol.2で開発したアニメキャラクター金髪化支援システムの発展について述べる.前号のシステムでは手作業による髪領域選択が必要であったが、今回は髪領域選択をFully Convolutional NetworkとGrabCutを用いて自動化したことで,全自動による金髪化が可能となった.
低ビットレートで符号化された映像は本来あるべき情報が欠落していたり, あるいは本来見られなかったようなノイズが重ねられる事により映像の視聴品質を低下させる問題がある. そこで本稿では pix2pix を用いてエンコード後の画像とエンコード前の画像間の変換を学習させることにより動画像にあらわれるノイズを低減するフィルタを学習することが出来るのではと考えその検証を行った.
フィクションの世界では,現実には成し遂げられないことを実現していく楽しみがあるはずである. 機械学習を含む科学技術というのも,やはりいまできないことを可能にしていく楽しみがあると考える. 本稿では,近年盛り上がりを見せている,創作作品における百合カップリングのその先として, 百合カップルにもしも娘をもうけることができたら,という妄想を,現在盛んに研究されている画像生成技術を用いて検証する.
一度も負けることなく競走馬を引退するのではないか・・・? それほど強かった「ディープインパクト」の引退から10年経った2016年,世間では「ディープラーニング」ブームが巻き起こっている. 近年,著しい発展を遂げているディープラーニングを駆使すれば,もう一度あの時のようなインパクトを与えることができるかもしれない. この記事は,そんな希望を持って,競馬予測の分野で一発当てるために試行錯誤した事例を紹介する.
<2016>年 3月 , AlphaGo と呼ばれる囲碁AIプログラムが世界最強とも謳われるプロに5戦して4勝1敗で勝ち越しという2016>結果となり, 大きな話題を読んだ. AlphaGo は基本的にモンテカルロ木探索と, 沢山の棋譜データから学習した 方策関数と評価関数を組み合わせて動作する. つまり沢山の棋譜データさえ用意出来れば, AlphaGo の手法を参考にすることで, ゲームを問わず, ゲームのエキスパートでない私でもそれなりに強いAIが作れるのではないだろうかと考えた. そこで, 同じような完全情報ゲームであるリバーシに着目して, AlphaGo の手法を参考にしてAIプログラムを作成し, 強そうなリバーシAIと戦わせてみた.
近年,金髪の人気が高まっていることが知られている(筆者調べ). そのため,既存のイラストの髪の色を金髪に変更する画像編集が(筆者によって)必要とされているが,GIMPなどの画像処理ソフトウェアではそこそこ手間のかかる作業が必要であった. 本稿では,この課題を解決するために開発されたイラスト中のキャラクターの髪を金髪に変更する作業を支援するソフトウェアについて述べる.
この章では、"このシーンもう少しヌルヌル動いて欲しいんだよなぁ"という要望を、ニューラルネットを利用して満たそうというものである。"もっと高解像度の萌え絵が欲しいんじゃぁ"という要望を満たす手法が存在するので、それを参考に、時間方向に拡張することで当手法とする。
@brly
本稿は, 丼丸を含む画像を HTTP POST した際に丼丸を含む矩形とその丼丸が何丼であるかの情報を 返すWebAPIを作成することを目的として, 試行錯誤した記録である. なお, 丼丸が一体何であるかについてはhttp://sasafune.co.jp/を参照されたい.
トピックモデルが提案されて10年以上が経過した.特に,今年2015年は多くの有益な日本語の情報が世に出てきたこともあり,今後ますます応用として使われていることが期待される.そのようなトピックモデルが実際にどの程度有効であるか検証するため,アニメ視聴ログに適用し情報推薦(レコメンド)問題を解いてみる.
ヘッドマウントディスプレイや3DCGは身近な技術となり,今は正にバーチャルリアリティの夜明けであると言われている.そんな中,従来映像として配信されてきたアニメの中の世界を体験するには,アニメ世界の3Dモデリングが要となるが,一般人にはこれは難しい.本稿では,この問題に対しコンピュータビジョンの分野からの解決を目指す.本稿では,街を多数の視点から写した写真群から街の3Dモデルが得られる Structure from Motion という手法を,3DCGアニメの映像に適用することで,放送されている3DCGアニメの映像から,その中の3Dモデルを自動的に再構成する問題を解いてみた.
この章では、巨乳化という、全貧乳キャラの悲願を、近年はやりの深層学習を用いて達成するための試行錯誤を解説する。つまり、ディープな学習でディープなバストを手に入れよう、というものである。2015年には、他の画像の画風を転写する手法や、イラストを入力することで巨乳度を計算できる手法などが提案された。本稿ではこれらの論文にアイデアを得て巨乳度の転写を目指す。