SIGNICO

統計・機械学習を用いて世の中のわりとどうでも良い問題を検証します.

SIGNICO vol.5 掲載論文一覧

機械学習で写真のポーズを自由に変える

@Hi_king

近年の画像生成技術の発展によって,我々は好みの嫁画像生成に近づいてきている.しかしヲタクの業は深いもので,嫁の画像が生成できれば次は動かしたくなるというのが性である.本稿では,任意の入力画像に好きなポーズを取らせるための手法を実装する.

漫画でわかる signico vol.1 "フレーム補完"

@brly

CycleGANを用いたリアルタイム結月ゆかり声質変換

@hiho_karuta

本稿では,音声のパラレルデータ(対応関係のあるデータ)を必要としないCycleGANという手法を使って声質変換する実験を行う.本手法では声質変換を,音韻性を重視した低次元音響特徴量の変換と,話者性を重視したスペクトログラムの高精細化の二段階に分ける.低次元音響特徴量の変換では,CycleGANを用いて学習する.スペクトログラムの高精細化では,pix2pixを用いて学習する.これらの変換で用いるニューラルネットワークは全て畳込み層のみから構成されており,リアルタイムで声質変換することができる.

Bayesian Active Learningがやりたい

@cocu_tan

オタク機械学習において学習データは著作物であることが多く,データのラベル付けが研究者の間で非常に苦痛の作業となっている事実がある(私感).本稿では,識別問題において訓練データのラベル付けのコストを削減する技術であるActive Learningと,そのベイズ的発展であるBayesian Active Learningを紹介する.加えて,ベイズ的な深層学習モデルであるBayesian Neural Networkの手法についても紹介し,実装のコストや精度についても言及する.Bayesian Neural Network入門記事みたいになってたらいいなぁ.

もっとも手軽に使える嫁画像生成ライブラリ

@Hi_king

ヲタクの情熱によって嫁画像生成はここ数年で圧倒的な進化を遂げた.その中で我々は,pipで一行でインストールでき,以下の三行で無限に嫁画像が生成される,もっとも手軽なライブラリを提案する.

from chainer_progressive_gan import KawaiiGenerator
for image in KawaiiGenerator():
  image.show()

SIGNICO vol.4 掲載論文一覧

ミスマッチ判別器を用いたイラストの着色転写手法の提案

@hiho_karuta

イラストの色特徴を他のイラストに転写したい.本実験では,GANを用いて色特徴ベクトルが線画とマッチするか判別することで,転写可能な色特徴空間を得る手法を提案する.

自由にポージングできる画像生成

@Hi_king

近年画像生成の研究が盛んに行われているが,実用性を考えると,完全自動生成ではなく製作者の意図を反映した画像生成を行いたい.本稿では,入力する意図として,ポーズを用いることで,自分の好きなポーズの画像を生成する.また,自分の写真からポーズを転写することで他人になりきる実験の基礎的検討を行う.

ニューラルネットワークで画像圧縮

@brly

広く利用されている画像圧縮フォーマットである JPEG, JPEG 2000 や H.265 の画面内予測手法を元にした BPG よりも ファイルサイズあたりの画質を上回る圧縮手法が提案された. 一般的な画像圧縮フォーマットが用いる係数変換, 量子化, 算術符号化などの手続きを踏襲しつつも GAN などの仕組みを利用して特徴の抽出, 再構成画像の画質向上などが行われている. 本稿では提案された手法の簡易的な実装およびその解説を行う.

SIGNICO vol.3 掲載論文一覧

実写←→アニメ画像変換

@hiho_karuta

近い将来,我々の姿を二次元に投射する技術が必要になるだろう.本報告では深層学習を用いて実写画像をアニメ画像に変換するモデルを提案する.対応関係のある実写画像とアニメ画像のデータセットは数が少ないため,対応関係のない画像を活用して画像変換の学習を行うが,この際,二種の画像ドメイン空間の対応関係を何らかの手法で得る必要がある.本報告では画像の形や色が近い空間は対応関係があると仮定し,対応関係のない実写画像とアニメ画像データセットを用いて画像変換を学習した例を示す.

ディープドット絵ジェネレータ

@Hi_king

我々には,かわいい画像をかわいさをなるべく保ったまま絵文字にしたいという欲求がある.本稿ではそれを機械学習によってサポートする.絵文字やドット絵を作るためには単に画像を縮小すればよいというものではなく,限られたピクセル数でなるべく元の絵のディティールを保った変換が必要である.本稿では,補助問題として超解像度画像生成を利用することで,逆の問題であるドット絵生成を実現する.

アニメキャラクター金髪化システムの構築 改

@kivantium

近年,金髪の人気が高まっていることが知られている(筆者調べ).本稿ではSIGNICO vol.2で開発したアニメキャラクター金髪化支援システムの発展について述べる.前号のシステムでは手作業による髪領域選択が必要であったが、今回は髪領域選択をFully Convolutional NetworkとGrabCutを用いて自動化したことで,全自動による金髪化が可能となった.

Re-Identification For Anime Character Searching(アニメキャラクター検索のための人物再識別)

@kanei_ri

anime characters across different images is a rather challenging task. Because of the viewpoint change, pose change, the confusing background and the variations of painting style across artists. We may not get satisfying result by traditional image based searching methods. Person Re-IDentification(Re-ID) is a technology aiming to match person images captured from two non-overlapping cameras which is also suitable for anime characters searching. Usually a Person Re-ID system is composed of two parts: 1) character detection; 2) feature extraction and matching. Compared with traditional image searching method, Person Re-ID system is a character based system which uses compact feature vector for searching, can be faster and more accurate.

pix2pix を用いたノイズ削減フィルタの学習

@brly__

低ビットレートで符号化された映像は本来あるべき情報が欠落していたり, あるいは本来見られなかったようなノイズが重ねられる事により映像の視聴品質を低下させる問題がある. そこで本稿では pix2pix を用いてエンコード後の画像とエンコード前の画像間の変換を学習させることにより動画像にあらわれるノイズを低減するフィルタを学習することが出来るのではと考えその検証を行った.

SIGNICO vol.2 掲載論文一覧

画像生成技術を用いた百合カップルの娘推定

@Hi_king

フィクションの世界では,現実には成し遂げられないことを実現していく楽しみがあるはずである. 機械学習を含む科学技術というのも,やはりいまできないことを可能にしていく楽しみがあると考える. 本稿では,近年盛り上がりを見せている,創作作品における百合カップリングのその先として, 百合カップルにもしも娘をもうけることができたら,という妄想を,現在盛んに研究されている画像生成技術を用いて検証する.

競馬予測界のディープインパクトを作るために 前編

@henry0312

一度も負けることなく競走馬を引退するのではないか・・・? それほど強かった「ディープインパクト」の引退から10年経った2016年,世間では「ディープラーニング」ブームが巻き起こっている. 近年,著しい発展を遂げているディープラーニングを駆使すれば,もう一度あの時のようなインパクトを与えることができるかもしれない. この記事は,そんな希望を持って,競馬予測の分野で一発当てるために試行錯誤した事例を紹介する.

非エキスパートが作るリバーシAI

@brly__

<2016>年 3月 , AlphaGo と呼ばれる囲碁AIプログラムが世界最強とも謳われるプロに5戦して4勝1敗で勝ち越しという結果となり, 大きな話題を読んだ. AlphaGo は基本的にモンテカルロ木探索と, 沢山の棋譜データから学習した 方策関数と評価関数を組み合わせて動作する. つまり沢山の棋譜データさえ用意出来れば, AlphaGo の手法を参考にすることで, ゲームを問わず, ゲームのエキスパートでない私でもそれなりに強いAIが作れるのではないだろうかと考えた. そこで, 同じような完全情報ゲームであるリバーシに着目して, AlphaGo の手法を参考にしてAIプログラムを作成し, 強そうなリバーシAIと戦わせてみた.

アニメキャラクター金髪化支援システムの構築

@kivantium

近年,金髪の人気が高まっていることが知られている(筆者調べ). そのため,既存のイラストの髪の色を金髪に変更する画像編集が(筆者によって)必要とされているが,GIMPなどの画像処理ソフトウェアではそこそこ手間のかかる作業が必要であった. 本稿では,この課題を解決するために開発されたイラスト中のキャラクターの髪を金髪に変更する作業を支援するソフトウェアについて述べる.

cupyを用いたCUDA開発

@kikusu

chainerで使われているnumpyのgpu版とも言えるcupy. cupyではCUDAの関数を直接書いて使うこともできるのでpythonのインタラクティブ性を活かしながらCUDAの開発ができます. ここではcupyのCUDA関数の開発の方法を解説しアニメーションを作成する事を目指します.

SIGNICO vol.1 掲載論文一覧

CNNでヌルヌルアニメーション

@Hi_king

この章では、"このシーンもう少しヌルヌル動いて欲しいんだよなぁ"という要望を、ニューラルネットを利用して満たそうというものである。"もっと高解像度の萌え絵が欲しいんじゃぁ"という要望を満たす手法が存在するので、それを参考に、時間方向に拡張することで当手法とする。

丼丸認識API

@brly

本稿は, 丼丸を含む画像を HTTP POST した際に丼丸を含む矩形とその丼丸が何丼であるかの情報を 返すWebAPIを作成することを目的として, 試行錯誤した記録である. なお, 丼丸が一体何であるかについてはhttp://sasafune.co.jp/を参照されたい.

トピックモデルを用いた次クールのアニメ視聴予測

@henry0312

トピックモデルが提案されて10年以上が経過した.特に,今年2015年は多くの有益な日本語の情報が世に出てきたこともあり,今後ますます応用として使われていることが期待される.そのようなトピックモデルが実際にどの程度有効であるか検証するため,アニメ視聴ログに適用し情報推薦(レコメンド)問題を解いてみる.

Structure from Motionで復元する3Dアニメの世界

@woodrush924

ヘッドマウントディスプレイや3DCGは身近な技術となり,今は正にバーチャルリアリティの夜明けであると言われている.そんな中,従来映像として配信されてきたアニメの中の世界を体験するには,アニメ世界の3Dモデリングが要となるが,一般人にはこれは難しい.本稿では,この問題に対しコンピュータビジョンの分野からの解決を目指す.本稿では,街を多数の視点から写した写真群から街の3Dモデルが得られる Structure from Motion という手法を,3DCGアニメの映像に適用することで,放送されている3DCGアニメの映像から,その中の3Dモデルを自動的に再構成する問題を解いてみた.

ディープバストアップへの道

@Hi_king

この章では、巨乳化という、全貧乳キャラの悲願を、近年はやりの深層学習を用いて達成するための試行錯誤を解説する。つまり、ディープな学習でディープなバストを手に入れよう、というものである。2015年には、他の画像の画風を転写する手法や、イラストを入力することで巨乳度を計算できる手法などが提案された。本稿ではこれらの論文にアイデアを得て巨乳度の転写を目指す。