HOME特別企画 > チュートリアル講演会
特別企画
チュートリアル講演会

「Deep Learningを用いた画像認識技術」「ハッシングによる効率的な大規模画像検索」「特徴点追跡による動画像からの逐次3次元復元とその応用」「コンピュータビジョンの最新ソフトウェア開発環境」をテーマに,第一線でご活躍の講師陣が,基礎技術から応用事例までをわかりやすく解説いたします.

講演会のスライド

ご講演スライドのうち以下のものは SlideShare で公開されています

ハッシングによる効率的な大規模画像検索
−近似近傍探索の新たなスタンダード−

講師:入江豪氏(NTT)

2004年 慶應義塾大学 理工学部卒業、2006年 同大大学院 理工学研究科 前期博士課程修了。 同年、日本電信電話(株)入社。現在、NTTメディアインテリジェンス研究所 研究主任。 2011年 東京大学大学院 情報理工学研究科 博士課程修了。2012年〜2013年 米コロンビア大学 客員研究員。 主に、マルチメディアの解析と検索に関する研究に従事。博士(情報理工学)。

概要:

スマートフォンやSNSの普及を背景として、人々がアクセス可能な画像の数は急激な増加を見せています。 膨大な画像の海から、いかにして所望 の画像を探し出すか。 そんな難問を解決するツールの一つとして、いま大きな期待を集めているのが、 ハッシングと呼ばれる近似近傍探索法です。 本チュートリアルでは、 ハッシングの基本的な考え方やいくつかの代表的な手法、最近の話題について、 分かりやすく解説していきます。

こんな方にお薦め:

  • 普通のコンピュータで、膨大な画像を効率的に処理・検索したいと思っている方
  • ハッシングやLSHという言葉は知っているが、どう役に立つのかわからないという方
  • この機会にハッシングについて一通り学んでみたいと思っている方

Deep Learningによる画像認識革命
−歴史・最新理論から実践応用までー

講師:中山英樹氏(東京大学)

2006年東京大学 工学部機械情報工学科卒業。 2011年東京大学 大学院情報理工学系研究科 知能機械情報学専攻博士課程修了。博士(情報理工学)。 2008年〜2011年 日本学術振興会特別研究員(DC1)。 2011年〜2012年 ヤフー株式会社勤務。 2012年より東京大学 大学院情報理工学系研究科 創造情報学専攻 講師。 マルチメディアを中心としたデータマイニング、機械学習手法と応用アプリケーションの研究に従事。 PRMU研究奨励賞、情報処理学会全国大会奨励賞、計測自動制御学会 SI部門賞 若手奨励賞等を受賞。

概要:

Deep Learning(深層学習)は、大規模な多層ニューラネットワークを生データに直接適用し、タスクに必要な全ての構造を学習によって最適化する新しいパラダイムです。画像認識分野においても近年特に大きな注目を浴びていますが、その全体像の理解は難しく、一般にはまだハードルが高い技術であると言えます。 本チュートリアルでは、画像認識においてDeep Learningが起こしたブレイクスルーの本質に迫ると同時に、実践する際に必要となる道具・知識・ノウハウについて解説します。

こんな方にお薦め:

  • Deep Learningを用いた画像認識に興味があるが、何から手をつけたらよいか分からないという方
  • Deep Learningの登場により、画像認識の何が変わったのか、なぜ優れた性能が実現できるのかを知りたい方
  • 画像認識分野および関連分野におけるDeep Learning研究の最新動向を知りたい方

特徴点追跡による動画像からの逐次3次元復元とその応用
−座標系の基礎から応用事例・最新研究動向まで−

講師:佐藤智和氏(奈良先端科学技術大学院大学)

1999年大阪府立大学工学部情報工学科卒業、2001年奈良先端科学技術大学院大学情報科学研究科博士前期課程修了、2003年同大情報科学研究科博士後期課程修了、博士(工学)、同年、同学情報科学研究科助手、2007年同大情報科学研究科助教、2010年チェコ工科大学CMP客員研究員、2011年より奈良先端科学技術大学院大学情報科学研究科准教授、2013年Best Poster- Honourable Mention of ISMAR2013受賞、2014年電子情報通信学会情報・システムソサイエティ査読功労賞受賞。

概要:

撮影映像を用いたカメラの逐次運動推定は、拡張現実感システムにおけるカメラトラッキングや移動体の自己運動推定に利用できます。本チュートリアルでは、映像中の自然特徴点の動き情報に基づいてカメラの動きと被写体の疎な形状を逐次推定するvisual SLAMについて、座標系の基礎から、特徴点追跡手法、3次元復元アルゴリズム、最適化手法、応用事例、最近の研究動向まで、幅広く解説します。

こんな方にお薦め:

  • カメラの運動推定・3次元復元に興味のある方
  • visual SLAMの原理・利点・欠点について知りたい方
  • マーカ無しの拡張現実感システムを作ってみたい方
  • リアルタイム画像処理が好きな方

コンピュータビジョンの最新ソフトウェア開発環境
−OpenCV,PCLの導入・機能紹介。プログラミング言語の選択と開発ツールの活用−

講師:林昌希氏(慶應義塾大学)

2007年 慶應義塾大学大学院理工学研究科 前期博士課程修了。 2007年〜2011年 株式会社 東陽テクニカ (開発部)。 2011年 慶應義塾大学大学院理工学研究科 後期博士課程在学中。 現在は、機械学習を用いた、スポーツ動画からの人物姿勢推定(メインの研究興味)、人物追跡、および行動認識の研究に従事。

概要:

以下の2つの内容を通して、最新のコンピュータビジョンでのソフトウェア開発環境の知識を確固たるものにしていただきます。
【内容@:OpenCVとPCLの最新情報】
コンピュータービジョン分野の代表的な大規模オープンソースライブラリ「OpenCV」と「Point Cloud Library(PCL)」ついて、最新機能と全体像の紹介を行います。OpenCVについては新メジャーバージョンである3.0の新機能紹介を中心にし、PCLについては(2014年11月時点で)最新の1.7.2の最新機能の紹介をします。人検出やデプスベースのSLAMなど、3D入力の方が有利なもののうち、既にPCLに実装されている処理を紹介し、これらをOpenCVのものと比較することで、画像とデプス(点群)での比較も行う予定です。
【内容A:プログラミング言語の選択と開発ツールの活用】
「C/C++系」もしくは「Matlab/Python系」の言語を、「いつどのタイミングで使い分けるか」、「どういう時にどの言語環境が向いているか」について、機械学習の動向や、マルチコア処理などの側面なども考慮しながら整理し、皆様の研究開発ライフのソフトウェア開発面での成果最大化をはかります。また、バージョン管理ツールやテストなどの開発者がよく使う仕組みを、研究寄りの現場で導入する(もしくはしない)際の考え方についても話します。

こんな方にお薦め:

  • OpenCVの最新の状況や全体像を掴みたい方
  • Point Cloud Libraryでどこまで何ができるようになっているか把握しておきたい方
  • C/C++と Python/Matlabの境界線など、プログラミング言語ごとの使い分けを知りたい方
  • バージョン管理やテストなど、一般的な開発テクニックをビジョンで導入する際の落とし所を知りたい方

チュートリアル交流会

 全チュートリアル終了後、講師と聴講者の交流会を行います.  講演中に聞けなかったことや疑問に思ったこと等を,講師の方に直接質問することができます.  また、聴講者間で親睦を深められるように,自己紹介カードを用意していただく予定です.

チュートリアル交流会は満席となりました。多数のお申込ありがとうございました。

チュートリアル質問ブース

チュートリアルの講師の方に,デモセッションのブースで解説していただきます. 講師の方とインタラクティブに,チュートリアル講演ではあまり取り上げられなかった技術的な 質問や,応用の可能性なども,密に議論することができます. (SSII2015に参加される方であれば,どなたでも出入りできます)

質問ブース開設時間は以下の通りですので,ぜひお立ち寄りください.お手元のチュートリアルテキスト掲載の時間帯から変更になっていますのでご注意ください

  • 6月11日(木)10:00〜11:00 : 入江先生,中山先生
  • 6月11日(木)14:15〜15:15 : 佐藤先生,林先生