Timetable

Aug. 6th (Tue)Aug. 7th (Wed)Aug. 8th (Thu)Aug. 9th (Fri)
9:00RegistrationOral session 1A (OS-1A)
9:00 - 10:00
Keynote session
Prof. Mutsumi Imai

9:00 - 10:00
Keynote session
Prof. Masahiko Inami

9:00 - 10:00
10:00Opening remarksBreak 10 min.Break 10 min.Break 10 min.
Oral session 1B (OS-1B)
10:10 - 11:10
Oral session 2A (OS-2A)
10:10 - 11:10
Oral session 3A (OS-3A)
10:10 - 11:40
Invited talks
10:20 - 11:50
11:00
Break 10 min.Break 10 min.
Oral session 1C (OS-1C)
11:20 - 12:20
Oral session 2B (OS-2B)
11:20 - 12:20
Break 10 min.
Lunch break
11:50 - 13:00
70 min.
WLB session
12:00
WLB events
(3F Conference Room B)

/ Lunch break
12:20 - 13:30
70 min.
Sponsors events
(3F Conference Room B and E)

/ Lunch break
12:20 - 13:30
70 min.
International events (3F Conference Room B)
Mentorship events (3F Conference Room E)
/ Lunch break
12:20 - 13:30
70 min.
13:00Tutorial introduction
Tutorial 1
Ikuro Sato

13:10 - 14:40
Oral session 1D (OS-1D)
13:30 - 14:30
Oral session 2C (OS-2C)
13:30 - 14:30
Interactive
session 3A
IS-3A
(3F Conference Room A)

13:30 - 15:00
90 min.
Interactive
session 3B
IS-3B
(1F Exhibition Hall)

13:30 - 15:00
90 min.
14:00
Break 10 min.Break 10 min.
Break 10 min.Oral session 1E (OS-1E)
14:40 - 16:10
Oral session 2D (OS-2D)
14:40 - 16:10
Tutorial 2
Mayu Otani

14:50 - 16:20
15:00Break 10 min.
Special session
15:10 - 16:00
16:00Closing and award ceremony
Break 10 min.Break 10 min.
Break 10 min.Interactive session 1A
Sponsor exhibition A
Demo session
IS-1A, EX-A, DS
(3F Conference Room A)

16:20 - 18:20
120 min.
Interactive session 1B
Sponsor exhibition B
IS-1B, EX-B
(1F Exhibition Hall)

16:20 - 18:20
120 min.
Interactive session 2A
Sponsor exhibition A
Demo session
IS-2A, EX-A, DS
(3F Conference Room A)

16:20 - 18:20
120 min.
Interactive session 2B
Sponsor exhibition B
IS-2B, EX-B
(1F Exhibition Hall)

16:20 - 18:20
120 min.
Tutorial 3
Mariko Isogawa

16:30 - 18:00
17:00
18:00
Break 10 min.
Town meeting
18:30 - 19:00
19:00Networking
banquet
20:00
  • All events will be held in the Main Hall on the 4th floor unless a specific location is indicated.
  • Lunch will not be provided during lunch hours. If you are attending a lunch event, lunch may be provided, so please check each event page for details.
  • You can enter Kumamoto-jo Hall at the following times each day:
    • Tuesday, August 6: 09:00
    • Wednesday, August 7: 08:30
    • Thursday, August 8: 08:30
    • Friday, August 9: 08:30

Aug. 6th (Tue)

10:00 - 10:20 Opening remarks: 4F Main Hall

10:20 - 11:50 Invited talks: 4F Main Hall

Session chair: Yuki Fujimura (NAIST)

  • IT-01: Nobuhiko Wakai, Satoshi Sato, Yasunori Ishii (Panasonic Holdings), Takayoshi Yamashita (Chubu Univ.), “Deep Single Image Camera Calibration by Heatmap Regression to Recover Fisheye Images Under Manhattan World Assumption”, [CVPR]
  • IT-02: Yuzuru Nakamura, Yasunori Ishii (Panasonic Holdings), Takayoshi Yamashita (Chubu Univ.), “Active Domain Adaptation with False Negative Prediction for Object Detection”, [CVPR]
  • IT-03: Shintaro Shiba (Keio Univ., TU Berlin), Friedhelm Hamann (TU Berlin), Yoshimitsu Aoki (Keio Univ.), Guillermo Gallego (TU Berlin), “Event-Based Background-Oriented Schlieren”, [TPAMI]
  • IT-05: Daichi Horita (Univ. of Tokyo), Naoto Inoue, Kotaro Kikuchi, Kota Yamaguchi (CyberAgent), Kiyoharu Aizawa (Univ. of Tokyo), “Retrieval-Augmented Layout Transformer for Content-Aware Layout Generation”, [CVPR]
  • IT-06: Tianwei Chen, Yusuke Hirota (Osaka Univ.), Mayu Otani (CyberAgent), Noa Garcia, Yuta Nakashima (Osaka Univ.), “Would Deep Generative Models Amplify Bias in Future Models?”, [CVPR]
  • IT-07: Kosuke Sumiyasu, Kazuhiko Kawamoto, Hiroshi Kera (Chiba Univ.), “Identifying Important Group of Pixels using Interactions”, [CVPR]
  • IT-08: Mikihiro Tanaka, Kent Fujiwara (LY), “Role-aware Interaction Generation from Textual Description”, [ICCV]
  • IT-09: Qing Yu, Mikihiro Tanaka, Kent Fujiwara (LY), “Exploring Vision Transformers for 3D Human Motion-Language Models with Motion Patches”, [CVPR]
  • IT-10: Jiaxuan Li, Duc Minh Vo (Univ. of Tokyo), Akihiro Sugimoto (NII), Hideki Nakayama (Univ. of Tokyo), “EVCap: Retrieval-Augmented Image Captioning with External Visual-Name Memory for Open-World Comprehension”, [CVPR]
  • IT-11: Yusuke Takimoto, Hikari Takehara, Hiroyuki Sato (Huawei Technologies Japan K.K.), Zihao Zhu (Keio Univ., Huawei Technologies Japan K.K.), Bo Zheng (Huawei Technologies Japan K.K.), “Dr.Hair: Reconstructing Scalp-Connected Hair Strands without Pre-training via Differentiable Rendering of Line Segments”, [CVPR]
  • IT-12: Zhixiang Wang (Univ. of Tokyo, NII), Baiang Li (Hefei Univ. of Technology), Jian Wang (Snapchat), Yu-Lun Liu (National Yang Ming Chiao Tung Univ.), Jinwei Gu (Univ. of Hong Kong), Yung-Yu Chuang (National Taiwan Univ.), Shin’ichi Satoh (NII, Univ. of Tokyo), “Matting by Generation”, [SIGGRAPH]
  • IT-13: Yusuke Sekikawa, Shingo Yashima (DENSO IT Laboratory), “SAS: Structured Activation Sparsification”, [ICLR]
  • IT-14: Soichiro Kumano (Univ. of Tokyo), Hiroshi Kera (Chiba Univ.), Toshihiko Yamasaki (Univ. of Tokyo), “Theoretical Understanding of Learning from Adversarial Perturbations”, [ICLR]
  • IT-15: Atsuyuki Miyai (Univ. of Tokyo), Qing Yu (LY, Univ. of Tokyo), Go Irie (Tokyo Univ. of Science), Kiyoharu Aizawa (Univ. of Tokyo), “LoCoOp: Few-Shot Out-of-Distribution Detection via Prompt Learning”, [NeurIPS]
  • IT-16: Yuki Fujimura (NAIST), Masaaki Iiyama (Shiga Univ.), Takuya Funatomi, Yasuhiro Mukaigawa (NAIST), “Deep Depth from Focal Stack with Defocus Model for Camera-Setting Invariance”, [IJCV]
  • IT-17: Qingxiuxiong Dong, Toshimitsu Kaneko (Toshiba), Masashi Sugiyama (Riken, Univ. of Tokyo), “An Offline Learning of Behavior Correction Policy for Vision-Based Robotic Manipulation”, [ICRA]
  • IT-18: Takahiro Maeda, Norimichi Ukita (Toyota Technological Institute), “Fast Inference and Update of Probabilistic Density Estimation on Trajectory Prediction”, [ICCV]
  • IT-19: Xu Cao, Takafumi Taketomi (CyberAgent), “SuperNormal: Neural Surface Reconstruction via Multi-View Normal Integration”, [CVPR]
  • IT-04: Lang Huang (Univ. of Tokyo), Chao Zhang (Peking Univ.), Hongyang Zhang (Univ. of Waterloo), “Self-Adaptive Training: Bridging Supervised and Self-Supervised Learning”, [TPAMI]

13:00 - 13:10 Tutorial introduction: 4F Main Hall

13:10 - 14:40 Tutorial 1: 4F Main Hall

14:50 - 16:20 Tutorial 2: 4F Main Hall

16:30 - 18:00 Tutorial 3: 4F Main Hall


Aug. 7th (Wed)

9:00 - 10:00 Oral session 1A (OS-1A): 4F Main Hall

Session chair: Tsubasa Hirakawa (Chubu Univ.)

  • OS-1A-01: Shoma Iwai (Tohoku University)*; Atsuki Osanai (LY Corp.); Shunsuke KITADA (LY Corp.); Shinichiro Omachi (Tohoku University), “Layout-Corrector: Alleviating Layout Sticking Phenomenon in Discrete Diffusion Model”
  • OS-1A-02: 久保俊介, 松尾信之介 (九大), 末廣大貴 (横浜市大), 寺田和弘, 伊藤寛朗 (京大), 吉澤明彦 (奈良県立医科大), 備瀬竜馬 (九大), “巨大バッグに対するLearning from Label Proportionのための理論的ラベル比率摂動”
  • OS-1A-03: 砂田達巳, 塩原楓 (東大), 劉岳松, 丹治直人, 勢〆弘幸 (Septeni Japan), 肖玲, 山崎俊彦 (東大), “大規模マルチモーダルモデルを用いた広告画像の評価・改善”
  • OS-1A-04: He Zhu (Hokkaido University)*; Ren Togo (Hokkaido University); Takahiro Ogawa (Hokkaido University); Miki Haseyama (Hokkaido University), “Reliable and Personalized Federated Learning with Prompt-based Method for Visual Question Answering in Medical Domain”
  • OS-1A-05: 石山遼, 白川嵩大, 内田誠一, 松尾信之介 (九大), “組合せ最適化問題の画像的扱いによる高精度解法 — 巡回セールスパーソン問題へのTest-Time Augmentationの適用”
  • OS-1A-06: Yusuke Kuwana (Tokyo University of Science)*; Yuta Goto (Tokyo University of Science); Takashi Shibata (NEC Corporation); Go Irie (Tokyo University of Science), “Black-Box Forgetting”
  • OS-1A-07: 藤村友貴 (奈良先端大), 櫛田貴弘 (立命館大), 北野和哉, 舩冨卓哉, 向川康博 (奈良先端大), “学習ベース両眼ステレオが持つ事前知識のNeRFへの導入”

10:10 - 11:10 Oral session 1B (OS-1B): 4F Main Hall

Session chair: Takuhiro Kaneko (NTT)

  • OS-1B-01: 広橋佑紀 (中部大, オムロン), 平川翼, 山下隆義, 藤吉弘亘 (中部大), “視覚言語モデルの特徴空間分析に基づく極少数サンプルによるプロンプトラーニング”
  • OS-1B-02: 伊藤光一郎 (日立), “Referring Image Segmentationに向けたCLIPとSAM併用のための特徴量設計”
  • OS-1B-03: Jane Wu (University of California, Berkeley); Diego Thomas (Kyushu University)*; Ronald Fedkiw (Stanford), “3D reconstruction of clothed human bodies from a few views via normal maps”
  • OS-1B-04: 森合遼, 井上中順, 田中正行, 川上玲 (東工大), 池畑諭 (東工大, 国立情報学研究所), 佐藤育郎 (東工大, デンソーアイティーラボラトリ), “分布外データの棄却機能を持つモダンホップフィールドネットワーク”
  • OS-1B-05: Yuya Matsumoto (NEC Corporation)*; Kazumine Ogura (NEC Corporation); Gaku Nakano (NEC Corporation), “SimGlue: スケールや回転変化の大きい画像ペアに対するTransformerを用いた特徴点マッチング (SimGlue: Local Feature Matching for Image Pairs with Large Scale and Rotation Changes)”
  • OS-1B-06: Shota Harada (Hiroshima City University)*; Ryoma Bise (Kyushu University); Kiyohito Tanaka (Kyoto Second Red Cross Hospital); Seiichi Uchida (Kyushu University), “Semi-supervised Domain Adaptation Using Class Order for Severity Classification”
  • OS-1B-07: Takayuki Katsuki (IBM Research - Tokyo)*; haoxiang qiu (IBM); Tomoya Sakai (IBM Research - Tokyo); Takayuki Osogami (IBM Research - Tokyo); Tadanobu Inoue (IBM Research); Daiki Kimura (IBM Research); A. Cristiano I. Malossi (IBM Research - Zurich), “Domain Adaptation from Sequentially Arriving Target Images with Online Deep Sets”

11:20 - 12:20 Oral session 1C (OS-1C): 4F Main Hall

Session chair: Atsushi Hashimoto (OSX)

  • OS-1C-01: Yasufumi Kawano (Keio Univ.)*; Yoshimitsu Aoki (Keio University), “TAG: Guidance-free Open-Vocabulary Semantic Segmentation”
  • OS-1C-02: Huaying Zhang (Hokkaido University)*; Rintaro Yanagi (Hokkaido University); Ren Togo (Hokkaido University); Takahiro Ogawa (Hokkaido University); Miki Haseyama (Hokkaido University), “Integrating Query-target Relationship to Zero-shot Composed Image Retrieval from Masked Image-text Pairs”
  • OS-1C-03: Tomoya Sugihara (University of Tokyo)*; Shuntaro Masuda (The University of Tokyo); Ling Xiao (The university of Tokyo); Toshihiko Yamasaki (The University of Tokyo), “Language-Guided Self-Supervised Video Summarization Using Text Semantic Matching”
  • OS-1C-04: Michihiro Kuroki (The University of Tokyo)*; Toshihiko Yamasaki (The University of Tokyo), “Shapley Valueを用いた3D物体検出の判断根拠の説明 (Explainig 3D Object Detection through Shapley Value-Based Attribution Map)”
  • OS-1C-05: 松藤憲吾, 石林, 川原僚 (九工大), 岡部孝弘 (岡山大), “任意視点における直接・大域成分の生成とその質感編集への応用”
  • OS-1C-06: Takanobu Furuhashi (Nagoya Institute of Technology)*; Hidekata Hontani (Nagoya Institute of Technology); Tatsuya Yokota (Nagoya Institute of Technology), “Adaptive Block Sparse Regularization under Arbitrary Linear Transform”
  • OS-1C-07: 上田樹 (筑波大), 千葉直也 (東北大), 相澤宏旭 (広島大), 片岡裕雄 (産総研), 北原格 (筑波大), “Neural Density-Distance Fieldを用いたニューラルレンダリングの透過率バウンドおよび高速化”

12:20 - 13:30 Work life balance events: 3F Conference Room B

13:30 - 14:30 Oral session 1D (OS-1D): 4F Main Hall

Session chair: Tatsuya Yokota (NITech)

  • OS-1D-01: 鬼久保拓人, 松井勇佑 (東大), “画像生成モデルの追加学習に対する敵対的高周波領域攻撃”
  • OS-1D-02: Yugo Kubota (Kyushu University)*; Daichi Haraguchi (CyberAgent); Seiichi Uchida (Kyushu University), “Co-embedding Font Shapes and Impressions by Contrastive Learning”
  • OS-1D-03: 門田健明 (慶大), 備瀬竜馬 (九大), 田中聖人 (京都第二赤十字病院), 早志英朗 (阪大), “重症度比較における不確実性と信頼度に基づく教師なしドメイン適応”
  • OS-1D-04: Ryosuke Furuta (The University of Tokyo)*; Yoichi Sato (University of Tokyo), “Seeking Flat Minima with Mean Teacher on Semi- and Weakly-Supervised Domain Generalization for Object Detection”
  • OS-1D-05: 山倉隆太, 柳井啓司 (電通大), “微分可能レンダラーを用いたロゴ画像生成”
  • OS-1D-06: 西田悠真, 櫛田貴弘, 田中賢一郎 (立命館大), “遠赤外領域におけるBRDFの計測と解析”
  • OS-1D-07: Yang Yang (Osaka Univerisity)*; Hiroaki Santo (Osaka University); Yasuyuki Matsushita (Osaka University); Fumio Okura (Osaka University), “NeuraLeaf: Neural Parametric Leaf Models with Shape and Deformation Disentanglement”

14:40 - 16:10 Oral session 1E (OS-1E): 4F Main Hall

Session chair: Fumio Okura (Osaka Univ.)

  • OS-1E-01: Jiafeng Mao (The University of Tokyo)*; Xueting Wang (CyberAgent, Inc.); Kiyoharu Aizawa (The University of Tokyo), “Towards Semantic-Driven Initialization: Winning Tickets in Initial Noise”
  • OS-1E-02: 松井勇佑 (東大), 横田達也 (名工大), “ブロードキャスト積:テンソル形状を揃えた要素積演算”
  • OS-1E-03: Kenta Horikawa (Keio University)*; Hideo Saito (Keio University); Shohei Mori (Graz University of Technology); Mariko Isogawa (Keio University), “イベントフォーカルスタックを用いた深度推定 (Depth Estimation from Event Focal Stack)”
  • OS-1E-04: Ryo Watanabe (The University of Tokyo)*; Yusuke Mukuta (The University of Tokyo); Tatsuya Harada (The University of Tokyo / RIKEN), “スパイキングニューラルネットワークによる画像生成拡散モデル (Fully Spiking Denoising Diffusion Implicit Models)”
  • OS-1E-05: 謝舒翔 (東大, 産総研), 周舒意 (東大), 櫻田健 (産総研), 石川涼一 (東大), 大西正輝 (産総研), 大石岳史 (東大), “グリッドベースNeRFにおける周波数正則化”
  • OS-1E-06: 下津曲将, 竹崎隼平, 原口大地, 内田誠一 (九大), “Cyclic Diffusion Modelの提案とその文字画像変換への応用”
  • OS-1E-07: Diego Thomas (Kyushu University)*; Jean-Sebastien Franco (INRIA); Edmond Boyer (Inria), “3D Shape Modeling with Adaptive Centroidal Voronoi Tesselation on Signed Distance Field”
  • OS-1E-08: 近藤暖, 金崎朝子 (東工大), “説明文生成を補助タスクとする意味的視聴覚ナビゲーション”
  • OS-1E-09: Ryoya Nara (The University of Tokyo)*; Yusuke Matsui (The University of Tokyo), “Human-drawable and Interpretable Adversarial Attack”
  • OS-1E-10: Hitoshi Teshima (Kyushu University)*; Naoki Dr. Wake (Microsoft); Diego Thomas (Kyushu University); Yuta Nakashima (Osaka University); Hiroshi Kawasaki (Kyushu univ.); Katsushi Ikeuchi (Microsoft), “Text-Guided Diverse Scene Interaction Synthesis by Disentangling Actions from Scenes”

16:20 - 18:20 Interactive session 1A (IS-1A) / Sponsor exhibition A (EX-A) / Demo session (DS): 3F Conference Room A

  • EX-S1: GO株式会社 (GO Inc.)
  • EX-S2: グーグル合同会社 (Google Japan)
  • EX-S3: チームラボ株式会社 (teamLab)
  • EX-S4: 株式会社ELEMENTS (ELEMENTS, Inc.)
  • EX-S5: ファーストアカウンティング株式会社 (Fast Accounting Co., Ltd.)
  • EX-S6: エムスリー株式会社 (M3, Inc.)
  • EX-S7: 株式会社IMAGICA GROUP (IMAGICA GROUP Inc.)
  • EX-S8: フューチャー株式会社 (Future Corporation)
  • EX-S9: 八千代エンジニヤリング株式会社 (Yachiyo Engineering Co., Ltd.)
  • EX-S10: アジア航測株式会社 (Asia Air Survey Co.,Ltd.)
  • EX-S11: 株式会社アダコテック (Adacotech Incorporated)
  • EX-S12: 株式会社エクサウィザーズ (ExaWizards Inc.)
  • EX-S13: データ・タング株式会社 (Datatang Inc.)
  • EX-S14: 株式会社ジーデップ・アドバンス (GDEP ADVANCE,Inc)
  • DS-01: Hiroki Nakamura (Koseikai Takai Hospital)*; Tatsuhiko Masue (Gifu Prefectural General Medical Center); Kouki Fukuda (Gifu Prefectural General Medical Center); Takahiko Asano (Gifu Prefectural General Medical Center); Wonjik Kim (National Institute of Advanced Industrial Science and Technology); Hirokazu Nosato (National Institute of Advanced Industrial Science and Technology (AIST)), “YOLOv8を用いた乳児気管挿管時のリアルタイム声門認識システムの開発 (The development of real-time airway recognition system for infant intubation with YOLOv8)”
  • DS-02: 村地遼平, 髙橋龍平, 大萩優哉, 中村雄大, 小島太一 (三菱電機), 國廣和樹 (三菱電機モビリティ), “車載システム向けカメラでの脈拍推定技術の開発”
  • DS-03: Matthew Ishige (CyberAgent, Inc. )*; Yasuhiro Yoshimura (CyberAgent,Inc.); Haruhi Kono (CyberAgent,Inc.); Shota Iwami (CyberAgent,Inc.); Ryo Yonetani (CyberAgent), “オプトインカメラ: UWBデバイスを用いた位置推定に基づく映像中の人物同定とオプトインシステムへの応用 (Opt-In Camera: Person Identification in Video via UWB Device Positioning and Its Application to Opt-In Systems for Camera)”
  • DS-04: Mariko Yamaguchi (NTT corporation); Masaru Tsuchida (NTT Corporation); Takahiro Matsumto (NIPPON TELEGRAPH AND TELEPHONE CORPORATION)*; Tetsuro Tokunaga (NTT Corporation); Takayoshi Mochizuki (NTT Corporation), “照明スペクトルの最適化で物体色の見え方を制御する照明システムの提案 (Controlling the Color Appearance of Objects by Optimizing the Illumination Spectrum)”
  • DS-05: 大武一平, 北野和哉 (奈良先端大), 櫛田貴弘 (立命館大), 藤村友貴 (奈良先端大), 前島謙宣 (オー・エル・エム・デジタル, IMAGICAGROUP), 久保尋之 (千葉大), 舩冨卓哉, 向川康博 (奈良先端大), “イベントカメラによる人物姿勢推定の遅延補償を用いたリアルタイムエフェクトシステムの構築”
  • DS-06: 林大輔 (静岡大), 吉田道隆 (日本学術振興会), De Xing Lioe, 安富啓太, 川人祥二 (静岡大), 長原一 (阪大), 香川景一郎 (静岡大), “電荷領域符号化露光ToF CMOSイメージセンサと深層学習モデルによるトランジェントイメージングと距離推定システム”
  • DS-07: Shutaro Kubo (Osaka Institute of Technology)*; Yuki Yamaji (Osaka Institute of Technology); Hirotsugu Okuno (Osaka Institute of Technology), “初期視覚神経系の時空間応答特性を模擬した運動方向検出イメージセンサシステム (An image sensor system inspired by the spatiotemporal characteristics of visual neurons that detects motion direction)”
  • DS-08: 藤若雅也, 船田純一, 劉健全, 住吉泰明, 江頭公平 (NEC), “映像xLLMを活用したドライバーの運転評価”
  • DS-09: 出口裕之, 堀涼介 (慶大), 多田充徳 (産総研), 斎藤英雄 (慶大), “Realtime Smart Gait Poser:スマートシューズを用いた歩行姿勢のリアルタイム推定”
  • DS-10: 原涼成, 池田航, 五十川麻理子 (慶大), “動的背景下におけるイベントカメラを用いた三次元人物手指形状推定”
  • DS-11: Kota Izumi (The University of Electro-Communications)*; Keiji Yanai (The University of Electro-Communications, Tokyo), “WaveFontStyler: 音に基づくフォントスタイル変換 (WaveFontStyler:Sound-based font style transfer)”
  • DS-12: Takuo Tachibana (The University of Tokyo)*; Ken Sakurada (Kyoto University); Masaki Onishi (AIST), “大規模画像言語モデルを活用したCoarse-to-Fine型セマンティックシーン検索 (Coarse-to-Fine Semantic Scene Search Utilizing Large-scale Vision-and-language Model)”
  • DS-13: 岩井亮斗 (東邦大, 産総研), 野里博和 (産総研), 中島悠 (東邦大), “画像分類と画像匿名化を両立させた深層学習ベースの診断支援システムの構築”
  • DS-14: Yusuke Sekikawa (DENSO IT Laboratory)*; Jun Nagata (Keio University), “Sparse·Recurrent·Parallel ·Local Attention for SpatioTemporal Event Processing”
  • DS-15: Akihiro Higaki (Nara Institute of Science and Technology)*; Kazuya Kitano (Nara Institute of Science and Technology); Takahiro Kushida (Ritsumeikan University); Yuki Fujimura (Nara Institute of Science and Technology); Takuya Funatomi (Nara Institute of Science and Technology); Yasuhiro Mukaigawa (NAIST), “屈折型リサージュ光学系を用いたリサージュサンプリングによるライトフィールド計測 (Lissajous Sampling for Light Field Measurement using Refractive Lissajous Optics)”
  • OS-1A-01: Shoma Iwai (Tohoku University)*; Atsuki Osanai (LY Corp.); Shunsuke KITADA (LY Corp.); Shinichiro Omachi (Tohoku University), “Layout-Corrector: Alleviating Layout Sticking Phenomenon in Discrete Diffusion Model”
  • OS-1A-02: 久保俊介, 松尾信之介 (九大), 末廣大貴 (横浜市大), 寺田和弘, 伊藤寛朗 (京大), 吉澤明彦 (奈良県立医科大), 備瀬竜馬 (九大), “巨大バッグに対するLearning from Label Proportionのための理論的ラベル比率摂動”
  • OS-1A-03: 砂田達巳, 塩原楓 (東大), 劉岳松, 丹治直人, 勢〆弘幸 (Septeni Japan), 肖玲, 山崎俊彦 (東大), “大規模マルチモーダルモデルを用いた広告画像の評価・改善”
  • OS-1A-04: He Zhu (Hokkaido University)*; Ren Togo (Hokkaido University); Takahiro Ogawa (Hokkaido University); Miki Haseyama (Hokkaido University), “Reliable and Personalized Federated Learning with Prompt-based Method for Visual Question Answering in Medical Domain”
  • OS-1A-05: 石山遼, 白川嵩大, 内田誠一, 松尾信之介 (九大), “組合せ最適化問題の画像的扱いによる高精度解法 — 巡回セールスパーソン問題へのTest-Time Augmentationの適用”
  • OS-1A-06: Yusuke Kuwana (Tokyo University of Science)*; Yuta Goto (Tokyo University of Science); Takashi Shibata (NEC Corporation); Go Irie (Tokyo University of Science), “Black-Box Forgetting”
  • OS-1A-07: 藤村友貴 (奈良先端大), 櫛田貴弘 (立命館大), 北野和哉, 舩冨卓哉, 向川康博 (奈良先端大), “学習ベース両眼ステレオが持つ事前知識のNeRFへの導入”
  • OS-1B-01: 広橋佑紀 (中部大, オムロン), 平川翼, 山下隆義, 藤吉弘亘 (中部大), “視覚言語モデルの特徴空間分析に基づく極少数サンプルによるプロンプトラーニング”
  • OS-1B-02: 伊藤光一郎 (日立), “Referring Image Segmentationに向けたCLIPとSAM併用のための特徴量設計”
  • OS-1B-03: Jane Wu (University of California, Berkeley); Diego Thomas (Kyushu University)*; Ronald Fedkiw (Stanford), “3D reconstruction of clothed human bodies from a few views via normal maps”
  • OS-1B-04: 森合遼, 井上中順, 田中正行, 川上玲 (東工大), 池畑諭 (東工大, 国立情報学研究所), 佐藤育郎 (東工大, デンソーアイティーラボラトリ), “分布外データの棄却機能を持つモダンホップフィールドネットワーク”
  • OS-1B-05: Yuya Matsumoto (NEC Corporation)*; Kazumine Ogura (NEC Corporation); Gaku Nakano (NEC Corporation), “SimGlue: スケールや回転変化の大きい画像ペアに対するTransformerを用いた特徴点マッチング (SimGlue: Local Feature Matching for Image Pairs with Large Scale and Rotation Changes)”
  • OS-1B-06: Shota Harada (Hiroshima City University)*; Ryoma Bise (Kyushu University); Kiyohito Tanaka (Kyoto Second Red Cross Hospital); Seiichi Uchida (Kyushu University), “Semi-supervised Domain Adaptation Using Class Order for Severity Classification”
  • OS-1B-07: Takayuki Katsuki (IBM Research - Tokyo)*; haoxiang qiu (IBM); Tomoya Sakai (IBM Research - Tokyo); Takayuki Osogami (IBM Research - Tokyo); Tadanobu Inoue (IBM Research); Daiki Kimura (IBM Research); A. Cristiano I. Malossi (IBM Research - Zurich), “Domain Adaptation from Sequentially Arriving Target Images with Online Deep Sets”
  • OS-1C-01: Yasufumi Kawano (Keio Univ.)*; Yoshimitsu Aoki (Keio University), “TAG: Guidance-free Open-Vocabulary Semantic Segmentation”
  • OS-1C-02: Huaying Zhang (Hokkaido University)*; Rintaro Yanagi (Hokkaido University); Ren Togo (Hokkaido University); Takahiro Ogawa (Hokkaido University); Miki Haseyama (Hokkaido University), “Integrating Query-target Relationship to Zero-shot Composed Image Retrieval from Masked Image-text Pairs”
  • OS-1C-03: Tomoya Sugihara (University of Tokyo)*; Shuntaro Masuda (The University of Tokyo); Ling Xiao (The university of Tokyo); Toshihiko Yamasaki (The University of Tokyo), “Language-Guided Self-Supervised Video Summarization Using Text Semantic Matching”
  • OS-1C-04: Michihiro Kuroki (The University of Tokyo)*; Toshihiko Yamasaki (The University of Tokyo), “Shapley Valueを用いた3D物体検出の判断根拠の説明 (Explainig 3D Object Detection through Shapley Value-Based Attribution Map)”
  • OS-1C-05: 松藤憲吾, 石林, 川原僚 (九工大), 岡部孝弘 (岡山大), “任意視点における直接・大域成分の生成とその質感編集への応用”
  • OS-1C-06: Takanobu Furuhashi (Nagoya Institute of Technology)*; Hidekata Hontani (Nagoya Institute of Technology); Tatsuya Yokota (Nagoya Institute of Technology), “Adaptive Block Sparse Regularization under Arbitrary Linear Transform”
  • OS-1C-07: 上田樹 (筑波大), 千葉直也 (東北大), 相澤宏旭 (広島大), 片岡裕雄 (産総研), 北原格 (筑波大), “Neural Density-Distance Fieldを用いたニューラルレンダリングの透過率バウンドおよび高速化”
  • OS-1D-01: 鬼久保拓人, 松井勇佑 (東大), “画像生成モデルの追加学習に対する敵対的高周波領域攻撃”
  • OS-1D-02: Yugo Kubota (Kyushu University)*; Daichi Haraguchi (CyberAgent); Seiichi Uchida (Kyushu University), “Co-embedding Font Shapes and Impressions by Contrastive Learning”
  • OS-1D-03: 門田健明 (慶大), 備瀬竜馬 (九大), 田中聖人 (京都第二赤十字病院), 早志英朗 (阪大), “重症度比較における不確実性と信頼度に基づく教師なしドメイン適応”
  • OS-1D-04: Ryosuke Furuta (The University of Tokyo)*; Yoichi Sato (University of Tokyo), “Seeking Flat Minima with Mean Teacher on Semi- and Weakly-Supervised Domain Generalization for Object Detection”
  • OS-1D-05: 山倉隆太, 柳井啓司 (電通大), “微分可能レンダラーを用いたロゴ画像生成”
  • OS-1D-06: 西田悠真, 櫛田貴弘, 田中賢一郎 (立命館大), “遠赤外領域におけるBRDFの計測と解析”
  • OS-1D-07: Yang Yang (Osaka Univerisity)*; Hiroaki Santo (Osaka University); Yasuyuki Matsushita (Osaka University); Fumio Okura (Osaka University), “NeuraLeaf: Neural Parametric Leaf Models with Shape and Deformation Disentanglement”
  • IS-1-001: Tomoyasu Shimada (NTT Corporation)*; Kazuhiko Murasaki (NTT Corporation); Taiga Yoshida (NTT Corporation); Toshihiko Nishimura (NTT Corporation); Ryuichi Tanida (NTT Corporation), “ORS : Overlapping Region Sampling for Efficient Point Cloud Registration”
  • IS-1-002: Masaya Murata (Hiroshima City University)*; Daisuke Miyazaki (Hiroshima City University), “偏光とガイド法線を利用した未校正照度差ステレオ法による表面形状推定 (Surface Shape Estimation Using Uncalibrated Photometric Stereo with Polarization and Guided Normal)”
  • IS-1-003: Jose Reinaldo Cunha Santos A V Silva Neto (Osaka University)*; Tomoya Nakamura (Osaka University); Prof. Yasushi Yagi (Osaka University), “All-in-focus lensless imaging with open-aperture radial mask and diffusion-based reconstruction”
  • IS-1-004: Takayuki Kurozumi (NIPPON TELEGRAPH AND TELEPHONE CORPORATION)*; Shota Yamada (NTT); Seiichi Konya (NIPPON TELEGRAPH AND TELEPHONE CORPORATION); Shinji Fukatsu (NIPPON TELEGRAPH AND TELEPHONE CORPORATION), “広域3Dシーン再構成のための画像選択による高速化手法 (An acceleration method by image selection for wide-area 3D scene reconstruction)”
  • IS-1-005: Satoshi Sato (Panasonic Holdings Corporation)*; Takuya Funatomi (Nara Institute of Science and Technology); Yasuhiro Mukaigawa (NAIST); Motoki Yako (Panasonic Holdings Corporation); Atsushi Ishikawa ( Panasonic Holdings Corporation); Kunio Nobori (Panasonic Holdings Corporation), “圧縮ハイパースペクトルカメラにおける白板補正方法の検討 (Rethinking white balance calibration for hyperspectral camera based on compressive sensing)”
  • IS-1-006: Shogo Sato (NTT)*; Masaru Tsuchida (NTT Corporation); Mariko Yamaguchi (NTT corporation); Takuhiro Kaneko (NTT Corporation); Kazuhiko Murasaki (NTT Corporation); Taiga Yoshida (NTT Corporation); Ryuichi Tanida (NTT Corporation), “Evaluation Metrics for Real-World Intrinsic Image Decomposition”
  • IS-1-007: siwei zhou (osaka university)*; Youngha Chang (Tokyo City University); NOBUHIKO MUKAI (Tokyo City University); Hiroaki Santo (Osaka University); Fumio Okura (Osaka University); Yasuyuki Matsushita (Osaka University); Shuang Zhao (University of California, Irvine), “A Path-Space Differential Boundary Integral for Implicit Surfaces”
  • IS-1-008: 淺谷南己, 小路春樹, 長門伊吹, 中村匡芳 (京セラ), “許容誤差と計測誤差に着目したICPの部分的な重なりに対する加速法”
  • IS-1-009: takaki ikeda (kyushu university)*; Heyang Gao (Kyushu university ); Yi Tang (kitami institute of technology); Takafumi Iwaguchi (Kyushu Univ.); Diego Thomas (Kyushu University); Yoshihiro Sato (Kyoto University of Advanced Science); Hiroshi Kawasaki (Kyushu univ.), “A Practical Approach to Calibrating Cameras and Multiple Line-Lasers in Light Sectioning Systems for Underwater Application”
  • IS-1-010: 井手宥希, 今川孝久, 榎田修一 (九工大), “人物の重なりに対する頑健性向上のためのマスク処理を用いた姿勢推定”
  • IS-1-011: Kazuki Hirose (Keio University)*; Hideo Saito (Keio University); Hideaki Uchiyama (Nara Institute of Science and Technology); Masahiro Yamaguchi (NEC Corporation); Kisho Mihara (Kawasaki Municipal Kawasaki Hospital); Sachiko Matsuda (Keio University); Yosuke Uematsu (Keio University); Masayuki Tanaka (Keio University); Minoru Kitagou (Keio University); Yuko Kitagawa (Keio University), “スコピスト支援を目的とする画像の位置合わせを用いた腹腔鏡の回転推定手法の提案 (Estimating Rotation of Laparoscope Using Image Alignment for Navigating Scopists)”
  • IS-1-012: Pragyan Shrestha (University of Tsukuba)*; Xie Chun (University of Tsukuba); Yuichi Yoshii (Tokyo Medical University); Itaru Kitahara (University of Tsukuba), “RayEmb: Arbitrary Landmark Detection in X-Ray Images Using Ray Embedding Subspace”
  • IS-1-013: Hanwei Zhang (Kyushu University)*; Xu Cao (CyberAgent); Hiroshi Kawasaki (Kyushu univ.); Takafumi Taketomi (CyberAgent), “Spherical Gaussian Illumination from a Single Image via Shadow Clues”
  • IS-1-014: Yuma Matsubara (Nagoya Institute of Technology); Fumihiko Sakaue (Nagoya Institute of Technology); Jun Sato (Nagoya Institute of Technology)*, “複数反射面を用いた隠れた発光物体の3次元復元 (Reconstruction of Hidden Luminous Objects from Multiple Reflective Surfaces)”
  • IS-1-015: Taichi Ito (Nagoya Institute of Technology); Fumihiko Sakaue (Nagoya Institute of Technology); Jun Sato (Nagoya Institute of Technology)*, “シーンとの干渉を用いた頭頂カメラ動画からの人体姿勢推定 (Human Pose Estimation from Head Mounted Cameras using Scene Interference)”
  • IS-1-016: Hiroto Kozawa (Nagoya Institute of Technology); Fumihiko Sakaue (Nagoya Institute of Technology); Jun Sato (Nagoya Institute of Technology)*, “他車両への映り込みを用いた隠れた人体の位置推定 (Estimating Hidden Humans from Vehicle Reflections)”
  • IS-1-017: Taketo Kato (Waseda University)*, “3D Gaussian Splattingを利用した人間アバターの生成 (Generation of Human Avatars Using 3D Gaussian Splatting)”
  • IS-1-018: Shota Yamada (NTT)*; Takayuki Kurozumi (NIPPON TELEGRAPH AND TELEPHONE CORPORATION); Shinji Fukatsu (NTT), “異なる撮影条件から学習された複数の3Dモデルを組み合わせた3Dシーン再構成 (3D Scene Reconstruction Combined Multiple 3D Models Learned from Different Conditions)”
  • IS-1-019: 仵⼩軍, 横張和也, ⾕⽥隆⼀ (NTT), “分割階層的平面モデル推定による大規模3D点群の構造解析”
  • IS-1-020: Juan Wang (Tohoku University)*; Zhijie Wang (RIKEN AIP); Tomo Miyazaki (Tohoku University); Shinichiro Omachi (Tohoku University), “Improved Open-Vocabulary 3D Scene Understanding via Masked Feature Alignment (Improved open-vocabulary 3D scene understanding via masked feature alignment)”
  • IS-1-021: 橋田大雅, 山藤浩明, 大倉史生, 松下康之 (阪大), “多視点未較正照度差ステレオのためのテクスチャ空間におけるPBRマテリアル統合手法”
  • IS-1-022: 安永綾花, 斎藤英雄 (慶大), 森尚平 (グラーツ工科大), “MPI表現の誤差可視化による自由視点観察用多視点画像撮影支援システム”
  • IS-1-023: 水上皓太, 出口大輔, 村瀬洋 (名大), 川西康友 (理研), “モノクロ画像を入力としたカラー化NeRFの構築”
  • IS-1-024: 松﨑康平, 野中敬介 (KDDI総合研究所), “近傍点の重み予測に基づく点群の色アップサンプリング”
  • IS-1-025: 青木陽太, 山中高夫 (上智大), “数値表層モデルを活用した3D Gaussian Splatting”
  • IS-1-026: Daiki Kimura (IBM Research)*; Naomi Simumba (IBM Research); Marcus Freitag (IBM Research); Johannes Schmude (IBM); Linsong Chu (IBM Research); Daniela Szwarcman (IBM Research); Johannes Jakubik (IBM Research); Paolo Fraccaro (IBM UK); Carlos Gomes (IBM Research ); Dario Oliveira (IBM); Michal Muszynski (IBM Research); Michiaki Tatsubori (IBM Research - Tokyo), “Geospatial Foundation Model by Diversified Data”
  • IS-1-027: 下前仁志, 江角翼, 武村紀子 (九工大), “単視点カメラ画像を用いた座位姿勢推定”
  • IS-1-028: 渡邉大起 (千葉大), 品川政太朗, 舩冨卓哉 (奈良先端大), 前島謙宣 (オー・エル・エム・デジタル, IMAGICA GROUP), 向川康博, 中村哲 (奈良先端大), 久保尋之 (千葉大), “効率的なアニメ線画の着色作業にむけた逐次的な自動着色精度の改善手法”
  • IS-1-029: Mitsuki Watanabe (The University of Tokyo)*; Kiyoharu Aizawa (The University of Tokyo); Yoko Yamakata (The University of Tokyo), “食事画像の細粒度分類:大規模画像言語モデルを活用したデータセット構築 (Fine-Grained Classification of Food Images: Dataset Building with Large-Scale Image-Language Models)”
  • IS-1-030: 鈴木聡志, 東羅翔太郎, 増村亮 (NTT), “鳥瞰図状特徴表現の回転による正則化を用いたマルチビュー人物検出”
  • IS-1-031: Takeshi Ishikawa (Tohoku University)*; Tomo Miyazaki (Tohoku University); Shinichiro Omachi (Tohoku University), “Deepfake text検出:生成AIによるテキスト編集の検出手法とデータセットの開発 (Deep fake text detection: Development of detection method and dataset for text editing using generative AI)”
  • IS-1-032: Minako Yoshioka (Ritsumeikan)*; Yu Wang (Hitotsubashi University); Jien Kato (Kochi University of Technology); Jiaqing Liu (ritsumeikan), “動的不確実性を用いた映像データセットの軽量化 (Video dataset pruning using dynamic uncertainty)”
  • IS-1-033: 清水駿太, 石川博 (早大), “CLIPによる白黒画像の自動着色評価”
  • IS-1-034: Koji Kamma (Wakayama University)*, “Gradient Redirection for Stepping into Unexplored Regions of Weight Space for Effective Neural Network Training”
  • IS-1-035: 木場竣哉 (立命館大), 王彧 (一橋大), 劉家慶 (立命館大), 加藤ジェーン (高知工科大), “外部環境を考慮した人物属性の詳細認識”
  • IS-1-036: 森本文哉 (鹿児島大), 柿崎和也, 宮川大輝 (NEC), “距離学習における敵対的訓練とデータ拡張との協調性:画像分類タスクの精度向上に向けて”
  • IS-1-037: 黒木悠斗 (和歌山大), 八谷大岳 (和歌山大, 理研), 岩城麻子, 前田宜浩 (防災科研), 上田修功 (理研), 藤原広行 (防災科研), “地震ハザード評価のための地震動シミュレーションの代理モデルの構築とその拡張”
  • IS-1-038: Longzhen Li (Hokkaido University)*; Guang Li (Hokkaido University); Ren Togo (Hokkaido University); Keisuke Maeda (Hokkaido University); Takahiro Ogawa (Hokkaido University); Miki Haseyama (Hokkaido University), “Generative Dataset Distillation Considering Global-local Coherence”
  • IS-1-039: Essam Rashed (University of Hyogo)*; Hiroyuki Seshimo (University of Hyogo); Muhammad Nouman (University of Hyogo); Mohammad al-Shatouri (Suez Canal University), “BinSyn: Personalized MRI synthesis from binary anatomical maps”
  • IS-1-040: Sota Ito (Gifu University)*; Hiroaki Aizawa (Hiroshima University); Kunihita Kato (Gifu University), “実環境下での頑健なカメラポーズ推定に向けたDietNeRFによる視点拡張とiNeRFの統合 (Few-shot NeRF-based View Synthesis for Camera Pose Estimation with iNeRF)”
  • IS-1-041: Rihito Abiko (Tohoku University)*; Tomo Miyazaki (Tohoku University); Shinichiro Omachi (Tohoku University); Yasuhisa Fujii (Google), “品質評価モデルと拡散過程を用いた情景画像中テキストの可読性評価 (Assessing the readability of text in scene images using image quality assessment models and diffusion processes.)”
  • IS-1-042: Kosuge Shoui (YokohamaNationalUniversity)*, “時空間特徴を考慮したEnd-to-End Transformerによる精子検出・追尾モデルの構築 (Sperm Detection and Tracking Model Using End-to-End Transformer Considering Spatio-Temporal Features)”
  • IS-1-043: Xuanmeng Sha (Osaka Univ.)*; Tomohiro Mashita (Osaka Electro-Communication Univ.), “3D Local Feature Pretraining via Momentum Contrast”
  • IS-1-044: Ayumu Ueyama (chiba university)*; Hiroshi Kera (Chiba University); Kazuhiko Kawamoto (Chiba University), “VarteX: Enhancing Weather Forecast through Distributed Variable Representation”
  • IS-1-045: 庄野修 (追手門学院大), “物理学的常識に忠実な動画フレーム予測の学習:ボクセル表現を用いたモデルの検討”
  • IS-1-046: Kaito Sugiyama (Chiba University)*; Satoshi Suzuki (NTT Computer and Data Science Laboratories / The University of Electro-Communications); Hiroshi Kera (Chiba University); Kazuhiko Kawamoto (Chiba University), “FAST: Fourier Analytics-based Selective Test-time Adaptation”
  • IS-1-047: Joichiro Meguro (Tokyo Institute of Technology)*; Koichi SHINODA (Tokyo Institute of Technology), “拡散モデルを用いた農作物の空撮画像に対する異常検知 (Anomaly Detection for Aerial Images of Crops Using Diffusion Model)”
  • IS-1-048: 齋藤令次, 堀田一弘 (名城大), “2つの特徴マップ無相関化と量子ベクトルを活用したセマンティックセグメンテーション”
  • IS-1-049: 森信史, 山中高夫 (上智大), “事前学習モデルを活用したスタイルエンコーダによる画像のスタイル変換モデル”
  • IS-1-050: 岩瀬俊, 平本麗弥, 前田英作 (東京電機大), “CNNモデルの学習過程における概念獲得について”
  • IS-1-051: 三山晃季, 中西慶一, 徳永旭将 (九工大), “クラス事前確率を用いた半教師あり多クラス分類におけるコスト関数の提案”
  • IS-1-052: 桐山琳歌 (東京農工大), 幸島明男 (産総研), 清水郁子 (東京農工大), “低次元表現の組み合わせによるmixup手法の提案”
  • IS-1-053: 志久開人, 西村和也 (九大), 末廣大貴 (横浜市大), 田中聖人 (京都第二赤十字病院), 備瀬竜馬 (九大), “潰瘍性大腸炎の重症度推定を目的とした選択的集約トランスフォーマーによる順序ありクラスのマルチインスタンス学習”
  • IS-1-055: Tatsukichi Shibuya (Sony Semiconductor Solutions Corporation)*; Atsushi Irie (Sony Group Corporation), “Cooperative Learning of Quantization Levels and Thresholds for Binary Decomposable Quantization”
  • IS-1-056: Fuma Hidaka (The University of Tokyo)*; Yusuke Matsui (The University of Tokyo), “効率的に更新可能な学習型多次元索引 (Efficiently Updatable Learned Multi-dimensional Index)”
  • IS-1-057: 金子智一, 坂井亮介, 柴田剛志, 白石壮馬 (NEC), “物体中心表現学習に基づく弱教師アモーダルセグメンテーション”
  • IS-1-058: 東田進之介, 奧野弘嗣 (阪工大), “Spiking Neural Networkの学習における電気シナプス導入の効果”
  • IS-1-059: 斉藤優也, 松尾信之介, 内田誠一 (九大), 末廣大貴 (九大, 理研AIP), “最悪クラス誤差抑制:Boostingによるアプローチ”
  • IS-1-060: 相澤宏旭 (広島大), “Hypergradient DescentによるSharpness-Aware Minimizationにおける近傍半径ρの最適化”
  • IS-1-061: Xiaotong Ye (The University of Tokyo)*; Ling Xiao (The university of Tokyo); Chi Zhang (The University of Tokyo); Toshihiko Yamasaki (The University of Tokyo), “Multi-hop Question Answering over Incomplete Knowledge Graphs by Edge and Meaning Extensions”
  • IS-1-062: Taigo Sakai (Meijo university)*; Kazuhiro Hotta (Meijo University), “ニューロン間の類似度分布を考慮したニューロン増加型深層ニューラルネットワーク (Growing Deep Neural Network Considering with Similarity between Neurons)”
  • IS-1-063: Tsubasa Hirakawa (Chubu University)*; Takayoshi Yamashita (Chubu University); Hironobu Fujiyoshi (Chubu Univ.), “変分情報ボトルネックを導入したマルチラベル画像分類 (Multi-label Image Classification via Variational Information Bottleneck)”
  • IS-1-064: 豊田祥史 (九大), “Invariant Risk Minimizationの昨今の進展と限界”
  • IS-1-065: Shun Obikane (KOSÉ Corp.)*; Haruna Tagawa (Keio University); Yoshimitsu Aoki (Keio University), “複雑な類似性を持つ画像データセットのための教師なし距離学習 (Unsupervised Metric Learning for Image Dataset with Complex Similarities)”
  • IS-1-066: 亀井靖人, 伊藤天詞, 平川翼, 山下隆義, 藤吉弘亘 (中部大), “Long-Tailed物体認識における最適な損失関数の組み合わせ調査”
  • IS-1-067: Kodai Kawamura (Tokyo University of Science)*; Shunta Kimura (Tokyo University of Science); Shunya Yamagami (Tokyo University of Science); Go Irie (Tokyo University of Science), “Region-based Entropy Separation for One-shot Test-Time Adaptation”
  • IS-1-068: 小澤海斗, 久保孝富, 池田和司 (奈良先端大), “画像中のイヌに対するゼロショット・フューショットでの感情分類”
  • IS-1-069: 壬生大和, 遠里由佳子 (立命館大), “カテゴリを考慮するドメイン汎化手法の線虫胚画像のセグメンテーションへの応用”
  • IS-1-070: Chenkai ZHANG (Nagoya University)*; Daisuke Deguchi (Nagoya University); Jialei Chen (Nagoya University); Hiroshi Murase (Nagoya University), “Enhancing Explainability of End-to-End Autonomous Driving Models through additional fine-tuning (Crocodile: Enhancing Explainability of End-to-End Autonomous Driving Models through additional fine-tuning)”
  • IS-1-071: Masaki Kashiwagi (Hokkaido University)*; Keisuke Maeda (Hokkaido University); Ren Togo (Hokkaido University); Takahiro Ogawa (Hokkaido University); Miki Haseyama (Hokkaido University), “Noisy Label Learning-based Self-consuming Iterative Re-training”
  • IS-1-072: Xiang Li (Hokkaido University)*; Ren Togo (Hokkaido University); Keisuke Maeda (Hokkaido University); Takahiro Ogawa (Hokkaido University); Miki Haseyama (Hokkaido University), “Strategic Classification Model Reinforcement: Introducing Language-guided Counterfactual Images to Identify and Address Classification Weaknesses”
  • IS-1-073: Kazuki Egashira (The University of Tokyo)*; Mark Vero (ETH Zurich); Robin Staab (ETH Zürich); Jingxuan He (ETH Zurich); Martin Vechev (ETH Zurich), “Exploiting LLM Quantization”
  • IS-1-074: 福田幸平, 相澤宏旭, 栗田多喜夫 (広島大), “擬似ランダムラベルで学習されたロジットのL2ノルムに基づく分布外検知”
  • IS-1-075: Taiga Goncalves (Tohoku University)*; Tomo Miyazaki (Tohoku University); Shinichiro Omachi (Tohoku University), “Domain Generalizable Multi-Targeted Adversarial Attack using Dynamic Loss Weighting”
  • IS-1-076: Ryo Shibazaki (Chiba University)*; Hiroshi Kera (Chiba University); Kazuhiko Kawamoto (Chiba University), “敵対的摂動に頑健なPositive-Unlabeled学習 (Positive-Unlabeled Learning Robust to Adversarial Perturbations)”
  • IS-1-077: 橋口凌大, 玉木徹 (名工大), “動作区間検出データセットの動作区間長に応じたノイズ除去”
  • IS-1-078: 日高聡希, 堀田一弘 (名城大), “Segment Anythingを用いた投球動作の識別と癖発見”
  • IS-1-079: Kotoka Matsunaga (Keio University)*; Akimasa Kondo (Keio University); Hideo Saito (Keio University), “馬術における動作認識手法の比較と評価 (Comparison and Evaluation of Action Recognition Methods in Equestrian Videos)”
  • IS-1-080: 内田大智, 金森由博, 遠藤結城 (筑波大), “3Dビュー探索による画像審美性の向上”
  • IS-1-081: 佐藤竜雅, 星澤知宙, 入山太嗣, 小室孝 (埼玉大), “視点補間ネットワークによる質感を再現した任意視点画像生成”
  • IS-1-082: Ru Ito (Chiba University)*; Supatta Viriyavisuthisakul (Sirindhorn International Institute of Technology); Kazuhiko Kawamoto (Chiba University); Hiroshi Kera (Chiba University), “VAEによる超解像データセット生成のための画像劣化レベルの決定 (Determination of image degradation levels for super-resolution data set generation by VAE)”
  • IS-1-083: 益田裕也, 石川博 (早大), “部分的な超解像”
  • IS-1-084: 松山諒大, 植木一也 (明星大), “ChatGPTを用いた印象語とモチーフ画像からの俳句検索システムの検討”
  • IS-1-085: Tanaka Ryota (Nagoya university)*; Tomohiro Suzuki (Nagoya University); Keisuke Fujii (Nagoya University / RIKEN), “フィギュアスケートのジャンプにおける3次元姿勢を用いたTemporal Action Segmentation (Temporal Action Segmentation Using 3D Pose in Figure Skating Jumps)”
  • IS-1-086: 齊藤温人, 金崎朝子 (東工大), “オープンセット認識におけるクラス間の類似度に基づく学習クラス選択”
  • IS-1-087: 中西慶一, 徳永旭将 (九工大), “半教師あり協調学習に基づく画素単位の注釈が不要な画像領域分割の提案”
  • IS-1-088: Yoichi Furukawa (Meijo University)*; Kazuhiro Hotta (Meijo University); Yoichi Sakurada (Yamanashi University); Kenji Kashiwagi (Yamanashi University), “Multi modal Selective ViTを用いた加齢黄斑変性僚眼の遺伝子情報解析 (Genetic Analysis of Age-related Macular Degeneration Using Multi-modal Selective Vision Transformer)”
  • IS-1-089: Sho Takahashi (Tohoku University)*; Tomo Miyazaki (Tohoku University); Shinichiro Omachi (Tohoku University), “インスタンスセグメンテーションを用いた複雑性除去による異常検知手法 (Anomaly detection method using instance segmentation for complexity removal)”
  • IS-1-090: Haimin Yan (Ritsumeikan University)*; Xiangbo Kong (Toyama Prefectural University); Juncheng Wang (Ritsumeikan University); Hiroyuki Tomiyama (Ritsumeikan University), “Advanced Detector for Small Object Detection in UAV Aerial Imagery”
  • IS-1-091: Eisei Nakahara (Nihon University)*; Xiaomeng Wu (NTT Corporation), “Small-size Object Detection with Adaptive Anchor-Based Detectors”
  • IS-1-092: 山内俊典, 計良宥志, 川本一彦 (千葉大), “ピクセル間の相互作用値を考慮した物体検出モデルに対する視覚的説明手法”
  • IS-1-093: Yaohou Fan (Tohoku University); Tomo Miyazaki (Tohoku University); Shinichiro Omachi (Tohoku University)*, “Scene Text Reconstructor: A Pre-training Approach for Scene Text Detection with Mask Image Modeling”
  • IS-1-094: 中山晴斗, 辻栄翔, 竹長慎太朗 (筑波大, 産総研), 大西正輝 (産総研), “P2PNetの実応用における追加学習の有用性の検証”
  • IS-1-095: 植木一也 (明星大), 鈴木裕真, 佐藤開, 堀隆之, 宅島寛貴, 髙田拓実, 田之上隼人, Aiswariya Manoj Kumar, 西原大輝 (ソフトバンク), “マルチモーダル映像検索 ~テキスト・画像生成モデルを駆使した検索の高精度化~”
  • IS-1-096: Taiga Masuda (Chubu Univ.)*; Hiroki Adachi (Chubu University); Tsubasa Hirakawa (Chubu University); Takayoshi Yamashita (Chubu University); Hironobu Fujiyoshi (Chubu Univ.); Shohei Tanaka (OMRON SINIC X Corporation); Kuniaki Saito (OMRON SINIC X); Yoshitaka Ushiku (OMRON SINIC X Corp.), “Attention weightの操作による注目領域に着目したグラフ図のキャプション生成 (Figure Captioning Focused on the Attention Region by Manipulating Attention Weights)”
  • IS-1-097: 田村直樹 (サイバーエージェント, 名大), 関井大気 (サイバーエージェント), “SkeletonChain: 時系列骨格情報を通じたモダリティ共通文埋め込みのマルチモーダル学習”
  • IS-1-098: 戸倉健登, 松田一起, 和田唯我, 杉浦孔明 (慶大), “対照学習と階層的特徴抽出に基づく画像キャプション生成の自動評価”
  • IS-1-099: 田浦愛華, 植木一也 (明星大), 望月浩平, 南雲淳也, 小平孝之, 草野勝大 (三菱電機), “画像と言語のマルチモーダルモデルによる異常行動検知のための効果的なテキストの調査”
  • IS-1-100: 永田大輝, 武淑瓊, 大倉史生, 八木康史 (阪大), “デュアルタスク時のAction Unitを用いた表情分析に基づく認知機能障害の検出”
  • IS-1-101: Ii Mizuki (Toyohashi University of Technology); Yasushi Kanazawa (Toyohashi University of Technology)*, “自動追尾スポットライトシステムのための連携行動による新郎新婦の追跡 (Bride and Groom Tracking by Cooperated Action for Automatic Tracking Spotlight System)”
  • IS-1-102: 小林慎平, 檜作彰良, 中山良平 (立命館大), “マルチタスク学習による防犯カメラ映像における異常検知”
  • IS-1-103: 折橋翔太, 山根大河, 河田尚孝, 牧島直輝, 庵愛, 鈴木聡志, 田中智大, 増村亮 (NTT), “タスク切替トークンを用いた顔画像に対する複数タスクのEnd-to-Endモデリング”
  • IS-1-104: 田邉彩乃, 武藤良, 植木一也 (明星大), “複数和柄カテゴリの同時認識を実現するモデルの構築と評価”
  • IS-1-105: 近藤友哉, 入山太嗣, 小室孝 (埼玉大), “映り込みを考慮したスタイル転送を用いた物体の材質変換”
  • IS-1-106: Hiroko Yamabe (Ritsumeikan Univ.)*, “生成AIによる人物画像に対する真贋判定技術の検討 (Authenticity determination method for human face by using generative AI)”
  • IS-1-107: Shun Ozaki (Tohoku University)*; Shinichiro Omachi (Tohoku University); Tomo Miyazaki (Tohoku University); Yasuhisa Fujii (Google), “フレームのキャプショニングを用いた動画要約学習 (Training of video Summarization with frame captioning)”
  • IS-1-108: 松村碧海 (九大), 大町真一郎 (東北大), 内田誠一 (九大), “高圧縮可能な画像への変換”

16:20 - 18:20 Interactive session 1B (IS-1B) / Sponsor exhibition B (EX-B): 1F Exhibition Hall

  • EX-P1: 株式会社サイバーエージェント (CyberAgent, Inc.)
  • EX-P2: 株式会社日立製作所 (Hitachi, Ltd.)
  • EX-P3: HPCテック (HPCTECH)
  • EX-P4: 華為技術日本株式会社 (Huawei Technologies Japan K.K.)
  • EX-G1: 株式会社デンソーアイティ―ラボラトリ (DENSO IT Laboratory)
  • EX-G2: 株式会社センスタイムジャパン (Sense Time Japan Ltd.)
  • EX-G3: LINEヤフー株式会社 (LY Corporation)
  • EX-G4: オムロン株式会社 (OMRON Corporation)
  • EX-G5: キャディ株式会社 (CADDi Inc.)
  • EX-G6: 株式会社ZOZO NEXT (ZOZO NEXT, Inc.)
  • EX-G7: 株式会社BuySell Technologies (BuySell Technologies Co., Ltd.)
  • EX-G8: 株式会社ネットコンパス (NetCOMPASS Ltd.)
  • EX-G9: 日本電信電話株式会社(NTT R&D) (NIPPON TELEGRAPH AND TELEPHONE CORPORATION)
  • EX-G10: 株式会社メルカリ (Mercari, inc.)
  • EX-G11: Turing株式会社 (Turing Inc.)
  • EX-G12: 日産自動車株式会社 (Nissan Motor Co., Ltd.)
  • EX-G13: 株式会社東芝 (Toshiba corporation)
  • EX-G14: SB Intuitions株式会社 (SB Intuitions Corp.)
  • EX-G15: ダイキン工業株式会社 (DAIKIN INDUSTRIES, LTD.)
  • EX-G16: 株式会社NTTドコモ (NTT DOCOMO, INC.)
  • EX-G17: 株式会社tiwaki (tiwaki Co., Ltd.)
  • EX-G18: Sansan株式会社 (Sansan, Inc.)
  • EX-G19: Mantra株式会社 (Mantra Inc.)
  • EX-G20: 三菱重工業株式会社 (Mitsubishi Heavy Industries. Ltd.)
  • EX-G21: 日本電気株式会社 (NEC Corporation)
  • EX-G22: 住友重機械工業株式会社 (Sumitomo Heavy Industries, Ltd)
  • EX-G23: 株式会社本田技術研究所 (Honda R&D Co., Ltd.)
  • IT-01: Nobuhiko Wakai, Satoshi Sato, Yasunori Ishii (Panasonic Holdings), Takayoshi Yamashita (Chubu Univ.), “Deep Single Image Camera Calibration by Heatmap Regression to Recover Fisheye Images Under Manhattan World Assumption”, [CVPR]
  • IT-02: Yuzuru Nakamura, Yasunori Ishii (Panasonic Holdings), Takayoshi Yamashita (Chubu Univ.), “Active Domain Adaptation with False Negative Prediction for Object Detection”, [CVPR]
  • IT-03: Shintaro Shiba (Keio Univ., TU Berlin), Friedhelm Hamann (TU Berlin), Yoshimitsu Aoki (Keio Univ.), Guillermo Gallego (TU Berlin), “Event-Based Background-Oriented Schlieren”, [TPAMI]
  • IT-04: Lang Huang (Univ. of Tokyo), Chao Zhang (Peking Univ.), Hongyang Zhang (Univ. of Waterloo), “Self-Adaptive Training: Bridging Supervised and Self-Supervised Learning”, [TPAMI]
  • IT-17: Qingxiuxiong Dong, Toshimitsu Kaneko (Toshiba), Masashi Sugiyama (Riken, Univ. of Tokyo), “An Offline Learning of Behavior Correction Policy for Vision-Based Robotic Manipulation”, [ICRA]
  • IT-18: Takahiro Maeda, Norimichi Ukita (Toyota Technological Institute), “Fast Inference and Update of Probabilistic Density Estimation on Trajectory Prediction”, [ICCV]
  • IT-19: Xu Cao, Takafumi Taketomi (CyberAgent), “SuperNormal: Neural Surface Reconstruction via Multi-View Normal Integration”, [CVPR]
  • OS-1E-01: Jiafeng Mao (The University of Tokyo)*; Xueting Wang (CyberAgent, Inc.); Kiyoharu Aizawa (The University of Tokyo), “Towards Semantic-Driven Initialization: Winning Tickets in Initial Noise”
  • OS-1E-02: 松井勇佑 (東大), 横田達也 (名工大), “ブロードキャスト積:テンソル形状を揃えた要素積演算”
  • OS-1E-03: Kenta Horikawa (Keio University)*; Hideo Saito (Keio University); Shohei Mori (Graz University of Technology); Mariko Isogawa (Keio University), “イベントフォーカルスタックを用いた深度推定 (Depth Estimation from Event Focal Stack)”
  • OS-1E-04: Ryo Watanabe (The University of Tokyo)*; Yusuke Mukuta (The University of Tokyo); Tatsuya Harada (The University of Tokyo / RIKEN), “スパイキングニューラルネットワークによる画像生成拡散モデル (Fully Spiking Denoising Diffusion Implicit Models)”
  • OS-1E-05: 謝舒翔 (東大, 産総研), 周舒意 (東大), 櫻田健 (産総研), 石川涼一 (東大), 大西正輝 (産総研), 大石岳史 (東大), “グリッドベースNeRFにおける周波数正則化”
  • OS-1E-06: 下津曲将, 竹崎隼平, 原口大地, 内田誠一 (九大), “Cyclic Diffusion Modelの提案とその文字画像変換への応用”
  • OS-1E-07: Diego Thomas (Kyushu University)*; Jean-Sebastien Franco (INRIA); Edmond Boyer (Inria), “3D Shape Modeling with Adaptive Centroidal Voronoi Tesselation on Signed Distance Field”
  • OS-1E-08: 近藤暖, 金崎朝子 (東工大), “説明文生成を補助タスクとする意味的視聴覚ナビゲーション”
  • OS-1E-09: Ryoya Nara (The University of Tokyo)*; Yusuke Matsui (The University of Tokyo), “Human-drawable and Interpretable Adversarial Attack”
  • OS-1E-10: Hitoshi Teshima (Kyushu University)*; Naoki Dr. Wake (Microsoft); Diego Thomas (Kyushu University); Yuta Nakashima (Osaka University); Hiroshi Kawasaki (Kyushu univ.); Katsushi Ikeuchi (Microsoft), “Text-Guided Diverse Scene Interaction Synthesis by Disentangling Actions from Scenes”
  • IS-1-109: 中村遼平, 金崎朝子 (東工大), “単一画像からの関節付き物体の新規視点画像生成”
  • IS-1-110: 阪田征之助, 山藤浩明, 大倉史生, 松下康之 (阪大), “多視点全天球画像を用いた画像合成による不要領域を補間した環境マップ作成”
  • IS-1-111: 永井隆昌, 江崎健司, 後藤充裕, 瀬下仁志 (NTT), “Repetitive Action Countingにおけるインターバル区間を考慮したデータ拡張の有効性の検証”
  • IS-1-112: 内山泰熙, 五十川麻理子 (慶大), “No-Reference Image Quality Assessmentを用いた画像インペインティングのための修復領域最適化”
  • IS-1-113: Naoto Inoue (CyberAgent)*; Kento Masui (CyberAgent); Wataru Shimoda (CyberAgent.Inc); Kota Yamaguchi (CyberAgent), “OpenCOLE: Towards Reproducible Automatic Graphic Design Generation”
  • IS-1-114: Maki Iritani (名古屋工業大学); Fumihiko Sakaue (Nagoya Institute of Technology); Jun Sato (Nagoya Institute of Technology)*, “イラスト画像における自動着彩とレイヤー分割 (Automatic Coloring and Layering for Illustration Images)”
  • IS-1-115: 加藤恩妃, 久保田彰 (中大), “ゼロショット学習を用いた,可視光画像と近赤外線画像の融合による靄除去”
  • IS-1-116: 伊藤泰希, 武藤良, 植木一也 (明星大), “大規模マルチモーダルモデルを用いた画像内における潜在リスクの検知”
  • IS-1-117: Yongsong HUANG (Tohoku University)*; Tomo Miyazaki (Tohoku University); Xiaofeng Liu (Yale University); Zhengmi TANG (Tohoku University); Kaiyuan JIANG (Tohoku University); Yaohou Fan (Tohoku University); Dongming YU (Tohoku University); Shinichiro Omachi (Tohoku University), “Radiograph Super-Resolution with Pixel-Level Masked D-MNet Transformer”
  • IS-1-118: Yingxin Yan (Nagoya Institute of Technology); Fumihiko Sakaue (Nagoya Institute of Technology); Jun Sato (Nagoya Institute of Technology)*, “事前ぼけ復元を用いた視力推定と仮想矯正 (Visual Acuity Estimation and Correction by using Pre-Deblurring)”
  • IS-1-119: 小杉哲 (東工大), “Neural Lookup TableとPrompt Guidance Lossを用いた解釈可能な画像補正”
  • IS-1-120: 北上裕太郎 (阪府大), 井上勝文, 吉岡理文 (阪公大), “食材領域に着目した一人称視点動画における詳細調理行動認識”
  • IS-1-121: JIATONG ZHANG (waseda university)*; Sei-ichiro Kamata (waseda university), “Advanced Feature Fusion Networks for 3D Hand Reconstruction from Single Image”
  • IS-1-122: YUTO SHIBATA (Keio university)*; Yusuke Oumi (Keio University); Go Irie (Tokyo University of Science); Akisato Kimura (NTT Corporation); Yoshimitsu Aoki (Keio University); Mariko Isogawa (Keio University), “BGM2Pose: Active 3D Human Pose Estimation with Background Music”
  • IS-1-123: Qianru Qiu (CyberAgent, Inc.)*; Jiafeng Mao (CyberAgent, Inc.); Xueting Wang (CyberAgent, Inc.), “ControlColor: Palette-Guided Image Colorization with Latent Diffusion Models”
  • IS-1-124: Chen FU (The University of Tokyo)*; Yuesong Liu (Septeni, Inc.); Naoto Tanji (Septeni, Inc.); Hiroyuki Seshime Seshime (Septeni, ); Shengzhou Yi (The University of Tokyo); Ling Xiao (The university of Tokyo); Toshihiko Yamasaki (The University of Tokyo), “Constrianed advertisement layout generation based on Graph Neural Networks”
  • IS-1-125: 今泉健太, 宮川和, 深津真二 (NTT), “映像情報を用いた音源分離による空間再構成”
  • IS-1-126: Kazuoki Nagatomo (Waseda University)*; Hiroshi Ishikawa (Waseda University), “AOSAを用いた投手の牽制球と投球の分類根拠の可視化 (Visualization of Classification Criteria for Pitcher’s Pickoff Throws and Pitches Using AOSA)”
  • IS-1-127: Liangyang Ouyang (The University of Tokyo)*; Ruicong Liu (The University of Tokyo); Yifei Huang (The University of Tokyo); Ryosuke Furuta (The University of Tokyo); Yoichi Sato (University of Tokyo), “ActionVOS: Actions as Prompts for Video Object Segmentation”
  • IS-1-128: Ryoma Takehara (Keio University); Yoshihisa Shinozawa (Keio University)*; Yukako Iimura (Nippon Telegraph and Telephone Corporation); Shinobu Saito (Nippon Telegraph and Telephone Corporation), “少量データを用いたスクリーンショット画像からのUIパーツ検出方法 (Detection of UI parts from Screenshots with Small Dataset)”
  • IS-1-129: isao wakabayashi (YANMAR Holdings Co., Ltd.)*; yuichiro dake (YANMAR Holdings Co., Ltd.); hisashi sugiura (YANMAR Holdings Co., Ltd.), “魚体追跡と計数領域を用いた魚数カウントシステムの開発 (Development of fish counting system using fish tracking and counting area)”
  • IS-1-130: Motoharu Sonogashira (RIKEN)*; Masaaki Iiyama (Shiga University); Yasutomo Kawanishi (RIKEN), “Pseudo-label-based training for unknown-aware scene graph generation”
  • IS-1-131: Rento Yamaguchi (University of Electro-Communications)*; Keiji Yanai (The University of Electro-Communications, Tokyo), “MM-DiTベースのStable Diffusion 3によるゼロショット領域分割 (Zero-shot Segmentation by the MM-DiT Based Stable Diffusion 3)”
  • IS-1-132: Tomoyuki Suzuki (CyberAgent, Inc.)*; Jan Zdenek (CyberAgent); Kota Yamaguchi (CyberAgent), “グラフィックデザイン再編集のためのテキスト分離に向けて (Towards Text Decomposition for Graphic Design Re-editing)”
  • IS-1-133: 岡田啓佑, 小林智哉, 奥野弘嗣 (阪工大), “Border-Ownership選択性細胞の応答特性に学んだ図地分離アルゴリズムの性能評価”
  • IS-1-134: Yuta Goto (Tokyo University of Science)*; Satoshi Yamazaki (NEC Visual Intelligence Research Laboratories); Takashi Shibata (NEC Corporation); Jianquan Liu (NEC Corporation), “Open-vocabulary Scene Graph Generation via Synonym-based Predicate Descriptor”
  • IS-1-135: 隅山慎, 吉澤真太郎, 森優人 (トヨタ自動車), “交差点におけるオクルージョンに頑健なMultiple Object Trackingの提案”
  • IS-1-136: Haiyang Liu (The University of Tokyo)*; Xingchao Yang (Cyberagent, Inc); Shigeru Kuriyama (CyberAgent); Takafumi Taketomi (CyberAgent), “VideoMotionGraph++: Co-Speech Gesture Video Reenactment with Blending Diffusion Model and Neural Rhythm Embedding”
  • IS-1-137: 島田泰智 (室蘭工大), 平澤宏祐 (コニカミノルタ), 近藤敏志 (室蘭工大), “物体検出における特徴量距離を考慮した学習データ選択方法”
  • IS-1-138: Qingrui Hu (Nagoya University)*; Atom Scott (Nagoya University); Calvin Yeung (Nagoya University); Keisuke Fujii (Nagoya University / RIKEN), “Basketball-SORT: A Multi-Object Tracking Algorithm for Complex Occlusions in Basketball”
  • IS-1-139: Ryuichi Tomiya (Kobe University)*; Yoshihisa Katsube (株式会社イーグリッド); Fernando Roversi ( 株式会社イーグリッド); Yoshihiro Omura (株式会社イーグリッド); Ryoichi Takashima (Kobe University); Tetsuya Takiguchi (Kobe University), “Multi-Object Trackingを用いた道路損傷検出 (Road Damage Detection using Multi-Object Tracking)”
  • IS-1-140: 大島慈温, 堀史門, 玉木徹 (名工大), “時空間動作検出のための人物クエリマッチングのAVAデータセットに対する性能評価”
  • IS-1-141: 河野友香, 右田雅裕 (熊本大), 中野善, 山口聖, 湯浅光貴 (水産技術研究所), 戸田真志 (熊本大), “海上設置型顕微鏡seaMS映像を対象とした深層学習による赤潮プランクトン検知”
  • IS-1-142: Erika Mori (Keio University)*; Yue Qiu (National Institute of Advanced Industrial Science and Technology (AIST)); Hirokatsu Kataoka (National Institute of Advanced Industrial Science and Technology (AIST)); Yoshimitsu Aoki (Keio University), “対人知能に関する動画質問応答:LLMは人物交流を理解しているか? (Enhancing Social Intelligence with Large Language Models: A Feedback Loop Approach for Video Question Answering)”
  • IS-1-143: 大山佑太, 今川孝久, 榎田修一 (九工大), “Diffusion Action Segmentationにおけるフレーム特徴量へのマスキングに関する研究”
  • IS-1-144: 原口大地, 井上直人, 下田和, 山口光太 (サイバーエージェント), “GPTはグラフィックデザインの評価に利用できるのか?”
  • IS-1-145: Shun Takashige (ETH Zurich)*; Hermann Blum (ETH Zurich); Marc Pollefeys (ETH Zurich / Microsoft), “Ontology-based evaluation for truly open-vocabulary segmentation”
  • IS-1-146: 田上鈴奈, 小林大起, 秋月秀一, 橋本学 (中京大), “画像クラスタリングに基づくincorrectペアの生成によるCLIPモデルの対照学習性能の向上”
  • IS-1-147: Masaya Sato (Hokkaido University)*; Keisuke Maeda (Hokkaido University); Ren Togo (Hokkaido University); Takahiro Ogawa (Hokkaido University); Miki Haseyama (Hokkaido University), “Identify-and-generate: VQAにおける大規模マルチモーダルモデルの獲得知識と視覚情報の統合強化 (Identify-and-generate: Enhancing the integration of acquired knowledge and visual information in LMMs for VQA)”
  • IS-1-148: Zongyao Li (NEC Corporation)*; Thao-Nhu Nguyen (Dublin City University); Satoshi Yamazaki (NEC Visual Intelligence Research Laboratories); Jianquan Liu (NEC Corporation); Cathal Gurrin (Dublin City University), “Enhancing Video Moment Retrieval with Scene Graphs”
  • IS-1-149: 熊本優斗, 大谷健登 (名大), 鈴木大輝, 山高大乗 (デンソー), 武田一哉 (名大), “注視領域と視行動を用いた運転手の注意散漫検出”
  • IS-1-150: Ryo Fujii (Keio University)*; Ryo Hachiuma (NVIDIA); Hideo Saito (Keio University), “Is Tracking Necessary for the Trajectory Prediction?”
  • IS-1-151: Kazuki Matsumoto (Fukuoka University); Yudai Inoue (Fukuoka University); Da LI (Fukuoka University); Shintaro Ono (Fukuoka University)*, “時空間画像処理を用いた車載カメラ映像からの先行車両のインペイント (Inpainting of a preceding vehicle from in-vehicle camera video using spatio-temporal image processing)”
  • IS-1-152: chenxi shen (Kyushu university)*; Takafumi Iwaguchi (Kyushu Univ.); Shaodi You (University of Amsterdam); Masateru Kawakubo (Kyushu university); Michinobu Nagao (Tokyo Women’s Medical University); Hiroshi Kawasaki (Kyushu univ.), “Myocardial Flow Reserve Estimation from 4D-Coronary-CT using Deep Neural Network”
  • IS-1-153: Allam Shehata (Osaka University, Japan; Electronics Research Institute, Egypt)*; Prof. Yasushi Yagi (Osaka University), “Towards a Deep-3DMM Reversible Face de-identification Framework”
  • IS-1-154: Xiang Li (Osaka University)*; Chi Xu (Osaka University); Prof. Yasushi Yagi (Osaka University), “The OU-ISIR continuous authentication database comprising face and speech biometrics”
  • IS-1-155: Chi Xu (Osaka University)*; Xiang Li (Osaka University); Allam Shehata (Osaka University, Japan; Electronics Research Institute, Egypt); Prof. Yasushi Yagi (Osaka University), “The OU-ISIR Multimodal Biometric Database and Its Performance Evaluation”
  • IS-1-156: Kaede Shintani (Osaka University)*; Xiang Li (Osaka University); Chi Xu (Osaka University); Prof. Yasushi Yagi (Osaka University), “Correlation Analysis among Face, Voice, Body, and Palm Vein Biometrics Toward Cross-modal Biometric Authentication”
  • IS-1-157: アン・ジョンホ, 中嶋一斗, 吉野弘毅 (九大), 岩下友美 (JPL), 倉爪亮 (九大), “拡散モデルを用いたLiDAR点群投影ベースの歩容映像復元”
  • IS-1-158: 原虹暉, 柳井啓司 (電通大), “FontCLIPstyler: 言語によるシーンテキストスタイル変換”
  • IS-1-159: 藤武将人, 津崎このみ, 藤澤舞, 安達健二 (ファーストアカウンティング), “セマンティックセグメンテーションに基づく偽造証憑検知”
  • IS-1-160: 秋庭正樹, 内田誠一 (九大), “オンライン文字を用いた単一文字の筆記者同一性判定”
  • IS-1-161: Atsuki Sato (The University of Tokyo)*; Yusuke Matsui (The University of Tokyo), “PCF Learned Sort: O(nloglogn)の期待計算量を持つ学習型ソートアルゴリズム (PCF Learned Sort: a Learning Augmented Sort Algorithm with O(nloglogn) Expected Complexity)”
  • IS-1-162: Kazuhiko Murasaki (NTT Corporation)*; Ryuichi Tanida (NTT Corporation), “深度画像高解像度化のための位置ずれを考慮したGuided Filter (Misalignment-aware guided filter for depth image densification)”
  • IS-1-163: Wataru Ikeda (Keio University)*; Mariko Isogawa (Keio University), “D-EventEgo: 動的環境における一人称視点イベントカメラを活用した三次元人物姿勢推定 (D-EventEgo: Event-based Egocentric 3D Pose Estimation with Dynamic Scene)”
  • IS-1-164: Yuki Tajima (Meisei University)*; Yuya Komatsu (Meisei University); Ryo Muto (Meisei University); Kazuya Ueki (Meisei University), “スポーツ動作の骨格推定とユーモア動画生成への応用 (Sports Movement Pose Estimation and Its Application to Humorous Video Generation)”
  • IS-1-165: 望田康太, サイリサ, 中野鐵兵 (早大), 若林麻里, 佐藤朝美 (横浜市大), 小川哲司 (早大), “重症児感情状態推定モデル構築のためのフィードバックサイクルの検討:人の「見守り」による効率的なモデル構築”
  • IS-1-166: 保木悠佑, 石川博 (早大), “堅牢な産業画像異常検知のためのマルチスケール特徴抽出”
  • IS-1-167: 對野裕己, 宮川稜平, 山藤浩明, 松下康之, 大倉史生 (阪大), “3次元植物構造トラッキングのための中間形状表現を用いた葉形状推定”
  • IS-1-168: 田邊光, 柳井啓司 (電通大), “大規模視覚言語モデルと食品体積推定による食事画像からのカロリー量推定”
  • IS-1-169: 楊心明, 山肩洋子, 相澤清晴 (東大), “マルチモーダルLLMを用いた対話による食事管理とその評価”
  • IS-1-170: Xiangbo Kong (Toyama Prefectural University)*; Ken’ichi Koyanagi ( Toyama Prefectural University), “Detection of Incorrect Knee Torsion in Karate Low Kick Using Azure Kinect”
  • IS-1-171: Ami Oozono (Kochi University of Technology)*; Toru Kurihara (Kochi University of Technology), “4ch入力Mask R-CNNによる可視・熱画像と気温を使用した緑色果実の検出 (Detection of green fruits using visible and thermal imaging and temperature by 4ch input Mask R-CNN)”
  • IS-1-172: 藤原雄太 (立命館大), 孔祥博 (富山県立大), 田中亜実 (立命館大), 西川広記 (阪大), 冨山宏之 (立命館大), “3次元関節座標を用いた卓球の試合映像におけるストローク分類”
  • IS-1-173: 多田遥香, 謝淳, 北原格 (筑波大), “挨拶動画からのマルチモーダル情報に基づく感情推定を用いた協調学習のためのグループ形成方式”
  • IS-1-174: 飯塚正樹, 土屋智 (浜松ホトニクス), “Z-stack画像の周波数成分に着目した全焦点画像生成のための整合性評価手法”
  • IS-1-175: Utoku Kakiyama (Hosei University)*; Kazunari Hemmi (Hosei University); Tomoko Miyata (Inoue Zen Ladies Clinic); Nari Yamamoto (Inoue Zen Ladies Clinic); Toyofumi Hirakawa (Fukuoka University); Yoshihito Inoue (Inoue Zen Ladies Clinic); Kohei Miyata (Fukuoka University); Fusanori Yotsumoto (Fukuoka University); Chihiro Shibata (Hosei University), “マルチモーダル深層学習モデルを用いた子宮鏡画像と生成キャプションによる慢性子宮内膜炎の分類 (Classification of Chronic Endometritis by Hysteroscopic Images and Generated Captions Using a Multimodal Deep Learning Model)”
  • IS-1-176: Keita Takeda (Nagasaki University)*; Yuta Matsumura (Nagasaki University); Eiji Mitate (Kanazawa Medical University); Misa Sumi (Nagasaki University); Tomoya Sakai (Nagasaki University), “VLMは医用画像の識別的特徴を捉えているか? (Do VLMs discover discriminative features for medical images?)”
  • IS-1-177: Yuji Iwahori (Chubu University)*; Kosuke Suzuki (Nagoya Institute of Technology); Kenji Funahashi (Nagoya Institute of Technology); M K Bhuyan (IIT Guwahati ); Akira Ouchi (Aichi Cancer Center Hospital); Yasuhiro Shimizu (Aichi Cancer Center Hospital), “ESRGANとDiffusionモデルによるCT画像のリンパ節転移有無の分類精度向上手法 (Improving Classification Accuracy for Presence or Absence of Metastasis from CT Image using ESRGAN and Diffusion Model)”
  • IS-1-178: 黒沢飛弾, 森田哲郎, 谷岡真樹, 的場亮, 森實祐基 (岡山大), 諸岡健一 (熊本大), “深層学習を用いたEn face画像からのMDRF値の予測”
  • IS-1-179: 高野菜々, 西口敏司 (阪工大), 豊浦正広 (山梨大), “WSIの病変割合推定のためのアノテーション付与支援”
  • IS-1-180: 金子俊太 (東邦大), 野里博和 (産総研), 数藤恭子 (東邦大), “内視鏡画像を用いた3次元再構成におけるNeRFの適用性の検証”
  • IS-1-181: Pinwen WANG (Ritsumeikan University)*; Xiangbo Kong (Toyama Prefectural University); Norikazu Hayashi (NEXTY Electronics Corporation); Mei Jiang (NEXTY Electronics Corporation); Noriyoshi Kiuchi (NEXTY Electronics Corporation); Hiroyuki Tomiyama (Ritsumeikan University), “Creation of 3D Indoor Maps of a University Hall with Tablet LiDAR for Drone Flight Simulation”
  • IS-1-182: Jeonghun Baek (The University of Tokyo)*; Yusuke Matsui (The University of Tokyo); Kiyoharu Aizawa (The University of Tokyo), “Cross-Lingual Learning in Multilingual Scene Text Recognition”
  • IS-1-183: 時山千里, 天野敏之 (和歌山大), “SOTを用いた物質性を置き換えるプロジェクションマッピング”
  • IS-1-184: 本庄郁弥, 植松郁哉 (立命館大), 眞田慎 (立命館グローバル・イノベーション研究機構), 森佳樹, 島田伸敬 (立命館大), “HMD搭載深度センサによる物体形状の取得と物体把持方法のMR提示”
  • IS-1-185: Ayu Shigeta (Wakayama University)*; 敏之 天野 (和歌山大学), “プロジェクタカメラ系を用いた有彩色照明による色移りの色彩補償 (Color Compensation for Color Bleeding Caused by Chromatic Illumination Using a Projector-Camera System)”

18:30 - 19:00 Town meeting: 4F Main Hall


Aug. 8th (Thu)

9:00 - 10:00 Keynote session: 4F Main Hall

10:10 - 11:10 Oral session 2A (OS-2A): 4F Main Hall

Session chair: Yuta Nakashima (Osaka Univ.)

  • OS-2A-01: Kento Sasaki (Turing.Inc); Yuichi Inoue (Turing Inc.)*; Kazuki Fujii (Tokyo Institute of Technology); Kotaro Tanahashi (Turing Inc.); Yu Yamaguchi (Turing Inc.), “大規模言語モデルを用いた日本語視覚言語モデルの評価方法とベースラインモデルの提案 (Constructing and Evaluating Japanese Vision Language Models Using Large Language Models)”
  • OS-2A-02: Naoya Sogi (NEC Corporation)*; Takashi Shibata (NEC Corporation); Makoto Terao (NEC Corporation), “Object-Aware Query Perturbation for Cross-Modal Image-Text Retrieval”
  • OS-2A-03: 竹崎隼平 (九大), 田中聖人 (京都第二赤十字病院), 内田誠一 (九大), “誤りのある順序付きラベルでの自己緩和型共同学習による重症度推定”
  • OS-2A-04: 新田常顧, 小濱大和, 伊藤天詞, 平川翼, 山下隆義, 藤吉弘亘 (中部大), “事前学習モデルの特徴表現を維持したSingle-shot Foresight Pruning”
  • OS-2A-05: 松井勇佑 (東大), “学習型足切り表による高速な多様近傍探索”
  • OS-2A-06: Mana Masuda (Keio University)*; Jinhyung Park (Carnegie Mellon University); Shun Iwase (Carnegie Mellon University); Rawal Khirodkar (Meta); Kris Kitani (Carnegie Mellon University), “Generalizable Neural Human Renderer”
  • OS-2A-07: Tomoya Sakai (IBM Research - Tokyo)*; haoxiang qiu (IBM); Takayuki Katsuki (IBM Research - Tokyo); Daiki Kimura (IBM Research); Takayuki Osogami (IBM Research - Tokyo); Tadanobu Inoue (IBM Research), “Simple Class Relation Helps Generalized Few-Shot Semantic Segmentation”

11:20 - 12:20 Oral session 2B (OS-2B): 4F Main Hall

Session chair: Yuzuko Utsumi (OMU)

  • OS-2B-01: Jiaqi Bao (Cyberagent )*; Ryo Yonetani (CyberAgent), “Path Planning using Language-Guided Probabilistic Roadmaps”
  • OS-2B-02: 鈴木共生, 前野一樹, 橋本潔 (パナソニックコネクト), 石井育規 (パナソニックホールディングス), 山下隆義 (中部大), “物体特徴を捉えるためのFDSLとCGを組合せた事前学習”
  • OS-2B-03: 山本耕平, 大岸茉由, 柳井啓司 (電通大), “画像生成モデルによるカロリー量を考慮した食事画像編集”
  • OS-2B-04: Hiromasa Yamanishi (The University of Tokyo)*; Toshihiko Yamasaki (The University of Tokyo), “LLaVATour: 日本語観光データに特化した大規模マルチモーダルモデルの作成 (LLaVA-Tour: Large Language and Vision Assistant for Japanese Tourism)”
  • OS-2B-05: 趙在瀛, 熊野創一郎, 山崎俊彦 (東大), “Vision-Languageモデルを利用した画像分類におけるバイアスの言語的抽出と緩和”
  • OS-2B-06: Yuta Fujimoto (Nara Institute of Science and Technology)*; Kazuya Kitano (Nara Institute of Science and Technology); Yuki Fujimura (Nara Institute of Science and Technology); Takuya Funatomi (Nara Institute of Science and Technology); Yasuhiro Mukaigawa (NAIST), “岩石薄片を用いた不均一分光フィルタによるワンショット分光撮像 (Petrographic Thin Plate Based Non-Uniform Spectral Filter for One-Shot Hyperspectral Imaging)”
  • OS-2B-07: Jiro Abe (NEC Corporation)*; Gaku Nakano (NEC Corporation), “形状特徴量のレンダリングを活用したテクスチャレスな三次元点群に対するカメラ位置姿勢推定 (Visual localization on textureless point cloud by rendering geometric features)”

12:20 - 13:30 Sponsors events: 3F Conference Room B

12:20 - 13:30 Sponsors events: 3F Conference Room E

13:30 - 14:30 Oral session 2C (OS-2C): 4F Main Hall

Session chair: Yusuke Sekikawa (Denso IT)

  • OS-2C-01: Ryota Ishizaki (Tokyo University of Science)*; Shunya Yamagami (Tokyo University of Science); Yuta Goto (Tokyo University of Science); Go Irie (Tokyo University of Science), “Linear Calibration Approach to Knowledge-free Group-Robust Classification”
  • OS-2C-02: Yuki Imajuku (The University of Tokyo)*; Yoko Yamakata (University of Tokyo, Japan); Kiyoharu Aizawa (The University of Tokyo), “マルチモーダルLLMを用いた食事画像からのレシピ生成 (Recipe generation from food images using multimodal VLM)”
  • OS-2C-03: Shoma Iwai (Tohoku University)*; Tomo Miyazaki (Tohoku University); Shinichiro Omachi (Tohoku University), “画像圧縮におけるVQGAN活用のための双条件付き学習 (Dual Conditioned Training for Exploiting VQGAN in Image Compression)”
  • OS-2C-04: 河野創祐, 平尾寿希, 上田宇起, 川原僚 (九工大), 岡部孝弘 (岡山大), “ライトトランスポート獲得のための照明・露光パタンと復号処理の同時学習”
  • OS-2C-05: Masashi Suzuki (Chubu University)*; Tsubasa Hirakawa (Chubu University); Takayoshi Yamashita (Chubu University); Hironobu Fujiyoshi (Chubu Univ.); Komei Sugiura (Keio University), “Reactive BiasのチューニングによるViTへの人の知見の組み込み (Reactive Bias to embed human knowledge in ViT through tuning)”
  • OS-2C-06: 小栗悠太郎, 松井勇佑 (東大), “グラフベース近似最近傍探索における適応的開始点選択の理論的・実証的解析”
  • OS-2C-07: Weng Ian Chan (Osaka University)*; Hiroaki Santo (Osaka University); Yasuyuki Matsushita (Osaka University); Fumio Okura (Osaka University), “Instance-wise Distribution Control of Text-to-image Diffusion Models”

14:40 - 16:10 Oral session 2D (OS-2D): 4F Main Hall

Session chair: Gaku Nakano (NEC)

  • OS-2D-01: Shogo Sato (NTT Corporation)*; Takuhiro Kaneko (NTT Corporation); Taiga Yoshida (NTT Corporation); Kazuhiko Murasaki (NTT Corporation); Ryuichi Tanida (NTT Corporation); Akisato Kimura (NTT Corporation), “Unsupervised Intrinsic Image Decomposition with LiDAR Intensity Enhanced Training”
  • OS-2D-02: Taro Togo (Hokkaido University)*; Ren Togo (Hokkaido University); Keisuke Maeda (Hokkaido University); Takahiro Ogawa (Hokkaido University); Miki Haseyama (Hokkaido University), “Refining Generative Class Incremental Learning Performance through Model Forgetting Strategies”
  • OS-2D-03: 東大樹, 松井勇佑 (東大), 牧淳人 (スウェーデン王立工科大), “ZoDi:拡散モデルに基づく画像変換を用いたゼロショットドメイン適応”
  • OS-2D-04: 江口達大, 竹崎隼平, 備瀬竜馬 (九大), “撮像条件情報を用いたガイダンスを導入した拡散モデルによる光超音波画像の画質改善”
  • OS-2D-05: 北沢一真 (筑波大), 青砥隆仁 (Optech Innovation), 池畑諭 (NII, 東工大), 髙谷剛志 (筑波大), “イベントカメラと運動光源を用いた法線推定”
  • OS-2D-06: 松本玲音 (九工大), 岡部孝弘 (岡山大), 川原僚 (九工大), “多焦点偏光画像群からの不透明微小物体の形状復元”
  • OS-2D-07: Shunta Kimura (Tokyo University of Science)*; Kodai Kawamura (Tokyo University of Science); Shunya Yamagami (Tokyo University of Science); Qing Yu (The University of Tokyo); Kiyoharu Aizawa (The University of Tokyo); Go Irie (Tokyo University of Science), “One-shot Test-Time Adaptation with Textual Inversion”
  • OS-2D-08: 篠田理沙 (京大), 塩原楓 (東大), “動物の顔認識に対する大規模データセット構築”
  • OS-2D-09: Yohanssen Pratama (Nara Institute of Science and Technology)*; Kazuya Kitano (Nara Institute of Science and Technology); Takahiro Kushida (Ritsumeikan University); Yuki Fujimura (Nara Institute of Science and Technology); Takuya Funatomi (Nara Institute of Science and Technology); Yasuhiro Mukaigawa (NAIST), “Pixel-Wise Material Classification Using Deep Learning by Utilizing Transient Responses”
  • OS-2D-10: Futa Kai Waseda (The University of Tokyo)*; Antonio Tejero-de-Pablos (CyberAgent), “How to Defend Image-Text Retrieval against Adversarial Attacks (How to Defend Image-Text Matching Tasks against Adversarial Attacks)”

16:20 - 18:20 Interactive session 2A (IS-2A) / Sponsor exhibition A (EX-A) / Demo session (DS): 3F Conference Room A

  • EX-S1: GO株式会社 (GO Inc.)
  • EX-S2: グーグル合同会社 (Google Japan)
  • EX-S3: チームラボ株式会社 (teamLab)
  • EX-S4: 株式会社ELEMENTS (ELEMENTS, Inc.)
  • EX-S5: ファーストアカウンティング株式会社 (Fast Accounting Co., Ltd.)
  • EX-S6: エムスリー株式会社 (M3, Inc.)
  • EX-S7: 株式会社IMAGICA GROUP (IMAGICA GROUP Inc.)
  • EX-S8: フューチャー株式会社 (Future Corporation)
  • EX-S9: 八千代エンジニヤリング株式会社 (Yachiyo Engineering Co., Ltd.)
  • EX-S10: アジア航測株式会社 (Asia Air Survey Co.,Ltd.)
  • EX-S11: 株式会社アダコテック (Adacotech Incorporated)
  • EX-S12: 株式会社エクサウィザーズ (ExaWizards Inc.)
  • EX-S13: データ・タング株式会社 (Datatang Inc.)
  • EX-S14: 株式会社ジーデップ・アドバンス (GDEP ADVANCE,Inc)
  • DS-01: Hiroki Nakamura (Koseikai Takai Hospital)*; Tatsuhiko Masue (Gifu Prefectural General Medical Center); Kouki Fukuda (Gifu Prefectural General Medical Center); Takahiko Asano (Gifu Prefectural General Medical Center); Wonjik Kim (National Institute of Advanced Industrial Science and Technology); Hirokazu Nosato (National Institute of Advanced Industrial Science and Technology (AIST)), “YOLOv8を用いた乳児気管挿管時のリアルタイム声門認識システムの開発 (The development of real-time airway recognition system for infant intubation with YOLOv8)”
  • DS-02: 村地遼平, 髙橋龍平, 大萩優哉, 中村雄大, 小島太一 (三菱電機), 國廣和樹 (三菱電機モビリティ), “車載システム向けカメラでの脈拍推定技術の開発”
  • DS-03: Matthew Ishige (CyberAgent, Inc. )*; Yasuhiro Yoshimura (CyberAgent,Inc.); Haruhi Kono (CyberAgent,Inc.); Shota Iwami (CyberAgent,Inc.); Ryo Yonetani (CyberAgent), “オプトインカメラ: UWBデバイスを用いた位置推定に基づく映像中の人物同定とオプトインシステムへの応用 (Opt-In Camera: Person Identification in Video via UWB Device Positioning and Its Application to Opt-In Systems for Camera)”
  • DS-04: Mariko Yamaguchi (NTT corporation); Masaru Tsuchida (NTT Corporation); Takahiro Matsumto (NIPPON TELEGRAPH AND TELEPHONE CORPORATION)*; Tetsuro Tokunaga (NTT Corporation); Takayoshi Mochizuki (NTT Corporation), “照明スペクトルの最適化で物体色の見え方を制御する照明システムの提案 (Controlling the Color Appearance of Objects by Optimizing the Illumination Spectrum)”
  • DS-05: 大武一平, 北野和哉 (奈良先端大), 櫛田貴弘 (立命館大), 藤村友貴 (奈良先端大), 前島謙宣 (オー・エル・エム・デジタル, IMAGICAGROUP), 久保尋之 (千葉大), 舩冨卓哉, 向川康博 (奈良先端大), “イベントカメラによる人物姿勢推定の遅延補償を用いたリアルタイムエフェクトシステムの構築”
  • DS-06: 林大輔 (静岡大), 吉田道隆 (日本学術振興会), De Xing Lioe, 安富啓太, 川人祥二 (静岡大), 長原一 (阪大), 香川景一郎 (静岡大), “電荷領域符号化露光ToF CMOSイメージセンサと深層学習モデルによるトランジェントイメージングと距離推定システム”
  • DS-07: Shutaro Kubo (Osaka Institute of Technology)*; Yuki Yamaji (Osaka Institute of Technology); Hirotsugu Okuno (Osaka Institute of Technology), “初期視覚神経系の時空間応答特性を模擬した運動方向検出イメージセンサシステム (An image sensor system inspired by the spatiotemporal characteristics of visual neurons that detects motion direction)”
  • DS-08: 藤若雅也, 船田純一, 劉健全, 住吉泰明, 江頭公平 (NEC), “映像xLLMを活用したドライバーの運転評価”
  • DS-09: 出口裕之, 堀涼介 (慶大), 多田充徳 (産総研), 斎藤英雄 (慶大), “Realtime Smart Gait Poser:スマートシューズを用いた歩行姿勢のリアルタイム推定”
  • DS-10: 原涼成, 池田航, 五十川麻理子 (慶大), “動的背景下におけるイベントカメラを用いた三次元人物手指形状推定”
  • DS-11: Kota Izumi (The University of Electro-Communications)*; Keiji Yanai (The University of Electro-Communications, Tokyo), “WaveFontStyler: 音に基づくフォントスタイル変換 (WaveFontStyler:Sound-based font style transfer)”
  • DS-12: Takuo Tachibana (The University of Tokyo)*; Ken Sakurada (Kyoto University); Masaki Onishi (AIST), “大規模画像言語モデルを活用したCoarse-to-Fine型セマンティックシーン検索 (Coarse-to-Fine Semantic Scene Search Utilizing Large-scale Vision-and-language Model)”
  • DS-13: 岩井亮斗 (東邦大, 産総研), 野里博和 (産総研), 中島悠 (東邦大), “画像分類と画像匿名化を両立させた深層学習ベースの診断支援システムの構築”
  • DS-14: Yusuke Sekikawa (DENSO IT Laboratory)*; Jun Nagata (Keio University), “Sparse·Recurrent·Parallel ·Local Attention for SpatioTemporal Event Processing”
  • DS-15: Akihiro Higaki (Nara Institute of Science and Technology)*; Kazuya Kitano (Nara Institute of Science and Technology); Takahiro Kushida (Ritsumeikan University); Yuki Fujimura (Nara Institute of Science and Technology); Takuya Funatomi (Nara Institute of Science and Technology); Yasuhiro Mukaigawa (NAIST), “屈折型リサージュ光学系を用いたリサージュサンプリングによるライトフィールド計測 (Lissajous Sampling for Light Field Measurement using Refractive Lissajous Optics)”
  • OS-2A-01: Kento Sasaki (Turing.Inc); Yuichi Inoue (Turing Inc.)*; Kazuki Fujii (Tokyo Institute of Technology); Kotaro Tanahashi (Turing Inc.); Yu Yamaguchi (Turing Inc.), “大規模言語モデルを用いた日本語視覚言語モデルの評価方法とベースラインモデルの提案 (Constructing and Evaluating Japanese Vision Language Models Using Large Language Models)”
  • OS-2A-02: Naoya Sogi (NEC Corporation)*; Takashi Shibata (NEC Corporation); Makoto Terao (NEC Corporation), “Object-Aware Query Perturbation for Cross-Modal Image-Text Retrieval”
  • OS-2A-03: 竹崎隼平 (九大), 田中聖人 (京都第二赤十字病院), 内田誠一 (九大), “誤りのある順序付きラベルでの自己緩和型共同学習による重症度推定”
  • OS-2A-04: 新田常顧, 小濱大和, 伊藤天詞, 平川翼, 山下隆義, 藤吉弘亘 (中部大), “事前学習モデルの特徴表現を維持したSingle-shot Foresight Pruning”
  • OS-2A-05: 松井勇佑 (東大), “学習型足切り表による高速な多様近傍探索”
  • OS-2A-06: Mana Masuda (Keio University)*; Jinhyung Park (Carnegie Mellon University); Shun Iwase (Carnegie Mellon University); Rawal Khirodkar (Meta); Kris Kitani (Carnegie Mellon University), “Generalizable Neural Human Renderer”
  • OS-2A-07: Tomoya Sakai (IBM Research - Tokyo)*; haoxiang qiu (IBM); Takayuki Katsuki (IBM Research - Tokyo); Daiki Kimura (IBM Research); Takayuki Osogami (IBM Research - Tokyo); Tadanobu Inoue (IBM Research), “Simple Class Relation Helps Generalized Few-Shot Semantic Segmentation”
  • OS-2B-01: Jiaqi Bao (Cyberagent )*; Ryo Yonetani (CyberAgent), “Path Planning using Language-Guided Probabilistic Roadmaps”
  • OS-2B-02: 鈴木共生, 前野一樹, 橋本潔 (パナソニックコネクト), 石井育規 (パナソニックホールディングス), 山下隆義 (中部大), “物体特徴を捉えるためのFDSLとCGを組合せた事前学習”
  • OS-2B-03: 山本耕平, 大岸茉由, 柳井啓司 (電通大), “画像生成モデルによるカロリー量を考慮した食事画像編集”
  • OS-2B-04: Hiromasa Yamanishi (The University of Tokyo)*; Toshihiko Yamasaki (The University of Tokyo), “LLaVATour: 日本語観光データに特化した大規模マルチモーダルモデルの作成 (LLaVA-Tour: Large Language and Vision Assistant for Japanese Tourism)”
  • OS-2B-05: 趙在瀛, 熊野創一郎, 山崎俊彦 (東大), “Vision-Languageモデルを利用した画像分類におけるバイアスの言語的抽出と緩和”
  • OS-2B-06: Yuta Fujimoto (Nara Institute of Science and Technology)*; Kazuya Kitano (Nara Institute of Science and Technology); Yuki Fujimura (Nara Institute of Science and Technology); Takuya Funatomi (Nara Institute of Science and Technology); Yasuhiro Mukaigawa (NAIST), “岩石薄片を用いた不均一分光フィルタによるワンショット分光撮像 (Petrographic Thin Plate Based Non-Uniform Spectral Filter for One-Shot Hyperspectral Imaging)”
  • OS-2B-07: Jiro Abe (NEC Corporation)*; Gaku Nakano (NEC Corporation), “形状特徴量のレンダリングを活用したテクスチャレスな三次元点群に対するカメラ位置姿勢推定 (Visual localization on textureless point cloud by rendering geometric features)”
  • OS-2C-01: Ryota Ishizaki (Tokyo University of Science)*; Shunya Yamagami (Tokyo University of Science); Yuta Goto (Tokyo University of Science); Go Irie (Tokyo University of Science), “Linear Calibration Approach to Knowledge-free Group-Robust Classification”
  • OS-2C-02: Yuki Imajuku (The University of Tokyo)*; Yoko Yamakata (University of Tokyo, Japan); Kiyoharu Aizawa (The University of Tokyo), “マルチモーダルLLMを用いた食事画像からのレシピ生成 (Recipe generation from food images using multimodal VLM)”
  • OS-2C-03: Shoma Iwai (Tohoku University)*; Tomo Miyazaki (Tohoku University); Shinichiro Omachi (Tohoku University), “画像圧縮におけるVQGAN活用のための双条件付き学習 (Dual Conditioned Training for Exploiting VQGAN in Image Compression)”
  • OS-2C-04: 河野創祐, 平尾寿希, 上田宇起, 川原僚 (九工大), 岡部孝弘 (岡山大), “ライトトランスポート獲得のための照明・露光パタンと復号処理の同時学習”
  • OS-2C-05: Masashi Suzuki (Chubu University)*; Tsubasa Hirakawa (Chubu University); Takayoshi Yamashita (Chubu University); Hironobu Fujiyoshi (Chubu Univ.); Komei Sugiura (Keio University), “Reactive BiasのチューニングによるViTへの人の知見の組み込み (Reactive Bias to embed human knowledge in ViT through tuning)”
  • OS-2C-06: 小栗悠太郎, 松井勇佑 (東大), “グラフベース近似最近傍探索における適応的開始点選択の理論的・実証的解析”
  • OS-2C-07: Weng Ian Chan (Osaka University)*; Hiroaki Santo (Osaka University); Yasuyuki Matsushita (Osaka University); Fumio Okura (Osaka University), “Instance-wise Distribution Control of Text-to-image Diffusion Models”
  • IS-2-001: 西拓実 (アイエンター), 川原僚 (九工大), 林将寛, 藤沼広和 (アイエンター), “仮想エピポーラ拘束を用いた水中ステレオカメラキャリブレーション方法の提案”
  • IS-2-002: 江島快, 中村友哉, 八木康史 (阪大), “遠方広視野高解像度撮像に向けた補償光学型アレイ光学系の基礎検討”
  • IS-2-003: 金澤樹希 (筑波大), 青砥隆仁 (Optech Innovation), 髙谷剛志 (筑波大), “Time-of-Flightイメージングを用いた材質分類における距離依存性の除去”
  • IS-2-004: Dixin Yang (Keio University)*; Mariko Isogawa (Keio University), “Efficient Circular and Confocal Non-line-of-sight Imaging with transient sinogram Super Resolution”
  • IS-2-005: 熊谷涼平, 上田宇起, 平尾寿希, 川原僚 (九工大), 岡部孝弘 (岡山大), “照明スペクトルと領域分割処理の同時学習によるワンショット蛍光物質検出”
  • IS-2-006: Kizuku Miyazawa (Nagoya Institute of Technology); Fumihiko Sakaue (Nagoya Institute of Technology)*; Jun Sato (Nagoya Institute of Technology), “高速DLPプロジェクタと焦点距離可変レンズを利用したトモグラフィックディスプレイによる3次元画像提示 (Tomographic Display by Using DLP Projector and Focus Tunable Lens)”
  • IS-2-007: 岡本流星 (千葉大), 山下聖悟, 加藤卓哉 (エクサウィザーズ), 久保尋之 (千葉大), “セルロースナノファイバーの偏光特性を用いた流れ場の可視化”
  • IS-2-008: Kazuma Fujiwara (Nara Institute of Science and Technology)*; Takuya Funatomi (Nara Institute of Science and Technology); Kazuya Kitano (Nara Institute of Science and Technology); Yuki Fujimura (Nara Institute of Science and Technology); Yasuhiro Mukaigawa (NAIST); Hiroshi Ochiai (Kyushu University), “Quantification of Overlapped Fluorescent Dyes via an Autoencoder with Simultaneous Optimization of LCVR Voltage Selector and Quantifier”
  • IS-2-009: 大石真也 (千葉大), 北沢太基, 林優一 (奈良先端大), 久保尋之 (千葉大), “漏えい電磁波による光源情報推定と光伝搬解析を用いたNLoSイメージング”
  • IS-2-010: 坪井真広 (IHI), “超解像に基づいた金属上の刻印の画像変換の検討”
  • IS-2-011: 高良優太, 前田涼汰, 日浦慎作 (兵庫県立大), “符号化開口を装着したイベントカメラによる匿名性の高い行動認識”
  • IS-2-012: Carlos Victorino Padeiro (Nagoya University)*; Tse-Wei Chen (Canon Inc.); Takahiro Komamizu (Nagoya University); Ichiro Ide (Nagoya University), “Leveraging Similarity-Preserving Post-Training Quantization for Lightweight Crop Disease Detection”
  • IS-2-013: 前田涼汰 (兵庫県立大, POSTECH), SeungHwan Baek (POSTECH), “イベントカメラを用いた動的シーンに対する偏光反射特性の計測”
  • IS-2-014: 佐古田峻輔, 中村友哉, 八木康史 (阪大), “時空間符号化照明と再構成ネットワークのEnd-to-end最適化による人物超解像シルエットイメージング—実験的検証—”
  • IS-2-015: Michitaka Yoshida (Japan Society for the Promotion of Science)*; Hayashi Daisuke (Shizuoka University); De Xing Lioe (Shizuoka University); Keita Yasutomi (Shizuoka University); Shoji Kawahito ( Shizuoka University); Keiichiro Kagawa (Shizuoka University); Hajime Nagahara (Osaka University), “超高時間分解コンピュテーショナルCMOSイメージセンサを用いたシングルショットTime of Flight Imaging (Single-shot efficient depth imaging based on time-compressive CMOS image sensor)”
  • IS-2-016: 中田健太, 前田涼汰, 久本直毅, 山添大丈, 日浦慎作 (兵庫県立大), “光飛行時間の直接計測による関与媒体に対して頑健な振動計測の検討”
  • IS-2-017: Miho Kurachi, Ryo Kawahara (Kyushu Institute of Technology), Takahiro Okabe (Okayama Univ.), “偏光に基づくワンショット表面素材識別のための照明最適化”
  • IS-2-018: 大見一樹, 玉木徹 (名工大), “時空間アクション検出のための人物クエリのマッチングによるアクションチューブ生成”
  • IS-2-019: Kosuke Arita (Canon Medical Systems Corporation)*; Yudai Yamazaki (Canon Medical Systems Corporation); Minoru Nakatsugawa (Canon Medical Systems Corporation), “距離学習と最適輸送の融合によるモデル誤差に頑健な皮膚内部成分定量化手法 (Robust Quantification Method for Skin Internal Components via Metric Learning and Optimal Transport against Model Error)”
  • IS-2-020: 三好優輝, 川原僚 (九工大), 岡部孝弘 (岡山大), “全方位偏光照明環境における実物体の光沢の操作”
  • IS-2-021: Masakatsu Aoki (NTT )*; Kazuya Yokohari (NTT); Ryuichi Tanida (NTT Corporation), “複数LiDAR計測環境におけるキャリブレーション作業の一検討 (A Study of Extrinsic Calibration Work in Multipule LiDAR Measurement Environments)”
  • IS-2-022: ZHENNAN WU (The University of Tokyo)*; Hiroyuki Sato (The University of Tokyo), “VoronoiTex: A Camera Position Sampling Strategy for Indoor Scene Texture Synthesis”
  • IS-2-023: 池田達弥, Miao Jiangdong, Bisser Raytchev, 溝口亮太, 平岡武宜, 中島卓司 (広島大), 清水圭吾 (マツダ), 檜垣徹, 金田和文 (広島大), “潜在空間編集による印象評価を用いた車の3次元形状生成の制御”
  • IS-2-024: Xu Leyang, 山藤浩明, 大倉史生, 松下康之 (阪大), “360度画像を用いた3Dガウシアン表現による自由視点レンダリング”
  • IS-2-025: 江本隼大 (岡山大), 宮内翔子 (九大), 諸岡健一 (熊本大), “局所点群分類法を用いた点群からのメッシュモデル生成”
  • IS-2-026: Xiangjie Li (The University of Tokyo)*; Shuxiang Xie (University of Tokyo); Ken Sakurada (Kyoto University); Ryusuke Sagawa (“AIST, Japan”); Takeshi Oishi (The University of Tokyo), “ニューラル表現を用いた可視-遠赤外線センサ融合による不可視シーンの3次元再構成 (Implicit Neural Fusion of RGB and Far-Infrared 3D Imagery for Invisible Scenes)”
  • IS-2-027: 幸壬晃 (滋賀大), 薗頭元春 (理研), 飯山将晃 (滋賀大), 川西康友 (理研), “破滅的忘却抑制を考慮したカメラポーズ選択によるPanoptic Liftingの増分学習”
  • IS-2-028: Kai Katsumata (The University of Tokyo)*; Shengze Zhong (CyberAgent); Takafumi Taketomi (CyberAgent), “不確実性推定付き3D Gaussian Splattingによる限られた観測からの新視点画像合成 (Novel View Synthesis from Limited Observations via 3D Gaussian Splatting with Uncertainty Estimates)”
  • IS-2-029: 小田友和, 牧野佳, 宮崎正巳 (NTT東日本), “車載ステレオカメラによる道路横断ケーブルの地上高推定”
  • IS-2-030: 黒住隆行, 山田翔大, 紺谷精一, 深津真二 (NTT), “広域3Dシーン再構成の主観評価による画質評価”
  • IS-2-031: 佐々木馨, 佐藤和仁, 山口周悟, 森島繁生 (早大), “時刻非同期映像を入力としたGaussian Splatting”
  • IS-2-032: Qianwen Lu (CyberAgent)*; Xingchao Yang (Cyberagent, Inc); Takafumi Taketomi (CyberAgent), “SynthMakeup: A Large-Scale Photo-Realistic Synthetic Makeup Dataset”
  • IS-2-033: 田中翔平, 王昊 (早大, オムロンサイニックエックス), 牛久祥孝 (オムロンサイニックエックス), “SciPostLayout: 科学論文ポスターのレイアウト解析およびレイアウト生成のためのデータセット”
  • IS-2-034: 高野寛己, 高久悠杜, 太田晋一 (宮城県産業技術総合センター), 宮崎智, 大町真一郎 (東北大), “生成画像を用いた工業画像マルチクラス分類と異常検知アルゴリズム性能との比較検証”
  • IS-2-035: Sai Htaung Kham (ZOZO Research)*; Kazuya Morishita (ZOZO Research); Yuki Hirakawa (ZOZO Research); Takashi Wada (ZOZO Research); Takuma Nakamura (BuySell Technologies Co., Ltd.); Yuki Saito (ZOZO Research), “The Niau Dataset: A Comprehensive Resource for Fashion Image Recognition”
  • IS-2-036: Hideki Tsunashima (Waseda University)*; Yixin Zhu (Peking University); Shigeo Morishima (Waseda Research Institute for Science and Engineering), “部分観測マルコフ決定過程下における系統的汎化ベンチマークの検討 (Considering A New Systematic Generalization Benchmark on POMDP)”
  • IS-2-037: Reo Terauchi (Tokyo Institute of Technology)*; Rei Kawakami (Tokyo Institute of Technology); Ikuro Sato (Tokyo Institute of Technology / Denso IT Laboratory), “汎化改善のためのモデル診断 (Model Diagnostics for Improving Generalization)”
  • IS-2-038: Emika Kurita (Keio University)*; Tomoya Oyama (Keio University); Shuitsu Koyama (Keio University); Mariko Isogawa (Keio University), “演奏音復元のための手書き邦楽譜文字認識 (Handwritten Japanese Traditional musical score character recognition for restoring performance sounds)”
  • IS-2-039: Ruka Murai (student)*; Yu Wang (Hitotsubashi University); Jiaqing Liu (ritsumeikan); Jien Kato (Kochi University of Technology), “監視カメラを用いた酔客推定 (Drunk Pedestrian Recognition using Surveillance Camera)”
  • IS-2-040: 村上尚生, 平松直人, 小林大起, 秋月秀一, 橋本学 (中京大), “固有空間における自然なデータ拡張に基づく外観検査の高精度化”
  • IS-2-041: Kensuke Tatematsu (waseda university)*; Hideki Tsunashima (Waseda University); Shigeo Morishima (Waseda Research Institute for Science and Engineering), “World Model SEED: Semantic Exploration via Expert Demonstration for Improving Sample Efficiency”
  • IS-2-042: Taku Fujitomi (NEC Corporation)*; Naoya Sogi (NEC Corporation); Takashi Shibata (NEC Corporation); Makoto Terao (NEC Corporation), “未来予測の最終状態を用いたロボット制御計画の成否識別 (Success or Failure Classification for Robot Control Planning using Final State of Future Prediction)”
  • IS-2-043: Hidenori Itaya (Chubu university)*; Tsubasa Hirakawa (Chubu University); Takayoshi Yamashita (Chubu University); Hironobu Fujiyoshi (Chubu Univ.); Komei Sugiura (Keio University), “Action Q-Transformerによる説明可能な強化学習 (Explainable Reinforcement Learning with Action Q-Transformer)”
  • IS-2-044: Tsunehiko Tanaka (Waseda University)*; Edgar Simo-Serra (Waseda University), “Object-Oriented Embeddings for Offline RL using Unsupervised Object Detection”
  • IS-2-045: 松本悠希, 三浦勝司 (住友電工), 尾澤知憲 (ユニコ), 奥野拓也 (住電通信エンジニアリング), “Sigmoid AttentionによるAttentionの修正機構を導入したDINOの提案及びHuman in the loopによる精度向上の試み”
  • IS-2-046: Kota Yamashita (Meijo University)*; Kazuhiro Hotta (Meijo University), “Domain GeneralizationのためのMixStyle-based Contrastive Test-time Adaptation (MixStyle-Based Contrastive Test-Time Adaptation for Domain Generalization)”
  • IS-2-047: 佐野景介 (デンソー), 平川翼, 山下隆義, 藤吉弘亘 (中部大), 小嶋信矢 (デンソー), “周波数別再構成による注意機構の学習”
  • IS-2-048: 栗岡保, 細野健人, 奥田悠太, 張軒 (博報堂テクノロジーズ), “極端なアスペクト比画像に対応するViT用前処理の提案”
  • IS-2-049: 加藤聡太, 堀田一弘 (名城大), “Generalized SAMを用いた可変な入力画素数に対するSAMの追加学習”
  • IS-2-050: Yuki Kotoyori (Tokyo University of Science); Yuta Goto (Tokyo University of Science)*; Takashi Shibata (NEC Corporation); Akisato Kimura (NTT Corporation); Go Irie (Tokyo University of Science), “記憶制御コードの最適化による選択的忘却 (Selective Forgetting with Mnemonic Code Optimization)”
  • IS-2-051: Ryo Karakida (National Institute of Advanced Industrial Science and Technology); Toshihiro Ota (CyberAgent, Inc.)*; Masato Taki (Rikkyo University), “Symmetry breaking in parallelized MLP-Mixer”
  • IS-2-052: Takayuki Kanai (Toyota Motor Corporation)*; Igor Vasiljevic (Toyota Research Institute); Vitor Guizilini (Toyota Research Institute); Kazuhiro Shintani (Toyota Motor Corporation), “A Study of the Initialization Effect of Learning-based SLAM with Dense Bundle Adjustment”
  • IS-2-053: 加太将弘, 吉橋亮太, 川上玲 (東工大), 池畑諭 (東工大, NII), 佐藤育郎 (東工大, デンソーアイティーラボラトリ), “摂動に対するスパース混合エキスパートモデルの頑健化”
  • IS-2-054: Xinyu Li (Waseda University)*; Sei-ichiro Kamata (Waseda University), “Quality-Aware Glaucoma Diagnosis Using Diffusion Models with Fundus Structural Feature Integration”
  • IS-2-055: 望月義彦 (埼玉工大), 藤木淳 (福岡大), 江口脩 (青森大), 大山航 (東京電機大), “Output Augmentationの可視化手法の検討”
  • IS-2-056: 大野優剛, 本田智則, 大西正輝 (産総研), “MaskedAutoEncoderを応用した世帯単位での短期電力需要予測モデルの開発”
  • IS-2-057: 鳥羽真仁, 内田誠一 (九大), 早志英朗 (阪大), “ClassifierDiffusion: 識別器による確率密度推定と外れ値検出への応用”
  • IS-2-058: Keisuke Kato (Sanei Hytechs Co., Ltd.)*; Bunta Furukawa (Sanei Hytechs Co., Ltd.); Masao Yamanaka (Toyota Motor Corporation), “AIモデル開発における疑似ラベルを用いた認識能力の拡張 (Expanding Recognition Capability of AI Model via Pseudo-Labels)”
  • IS-2-059: Hideaki Hayashi (Osaka University)*, “誤差逆伝播法を使用しない深層生成モデル (A Deep Generative Model without Backpropagation)”
  • IS-2-060: 持田海音, 中西慶一, 徳永旭将 (九工大), “欠損補完に基づく画像異常検知に対してマスクの色が与える影響の評価”
  • IS-2-061: WENQI ZHANG (Sophia University)*, “Improving Feature Extraction in GeoTransformer for Point Cloud Registration”
  • IS-2-062: Nagisa Koyama (Chubu University)*; Tsubasa Hirakawa (Chubu University); Takayoshi Yamashita (Chubu University); Hironobu Fujiyoshi (Chubu Univ.), “複数の点群データセットを用いたSelf-trainingによる3D物体検出の教師なしドメイン適応 (Unsupervised Domain Adaptation on 3D Object Detection Using Self-training with Multiple Point Cloud Datasets)”
  • IS-2-063: Yuma Tanimoto (The University of Tokyo)*; Tetsuya Kobayashi (The University of Tokyo); Atsushi Kamimura (The University of Tokyo), “深層生成隠れマルコフモデルの安定した学習手法の提案 (A stable learning method for deep generative hidden Markov models.)”
  • IS-2-064: 松井光太郎, Bisser Raytchev, 中直斗 (広島大), 川口幹祐, 植木義治, 小林謙太, 和田好隆, 上村匠, 佐藤圭峰 (マツダ), 檜垣徹, 金田和文 (広島大), “Active Learningを用いた流体解析の時間効率改善に関する研究”
  • IS-2-065: 春日岳紘, 川本一彦, 計良宥志 (千葉大), “ラベル比率からの学習における普遍的摂動に対する頑健性の検証”
  • IS-2-066: 笹谷典太, 井田孝, 山本晋太郎, 小野利幸 (東芝), “実画像を元にした人工画像による対照学習”
  • IS-2-067: Ren Togo (Hokkaido University)*; Nao Nakagawa (Hokkaido University); Takahiro Ogawa (Hokkaido University); Miki Haseyama (Hokkaido University), “Exponential Dissimilarity-Dispersion Family for VAE-based Domain-Specific Representation Learning”
  • IS-2-068: 福永玲央, 吉田壮, 棟安実治 (関西大), “対照学習を用いた類似クラス間の特徴量分離によるノイジーラベルに対する頑健性の向上”
  • IS-2-069: Naoto Hayashi (Chubu University)*; Tsubasa Hirakawa (Chubu University); Takayoshi Yamashita (Chubu University); Hironobu Fujiyoshi (Chubu Univ.); Yasunori Ishii (Panasonic Holdings); Yusuke Kato (Panasonic); Kazuki Kozuka (Panasonic Holdings Corporation), “多様性と学習不足を考慮したデータ選択による自己教師あり継続学習 (Data Selection Considering Diversity and Underfitting for Self-Supervised Continual Learning)”
  • IS-2-070: Antonio Tejero-de-Pablos (CyberAgent)*; Riku Togashi (CyberAgent, Inc., Waseda University); Mayu Otani (CyberAgent); Shin’ichi Satoh (National Institute of Informatics), “Source-Free Domain Adaptation with Class Distribution Shift via Generic Features”
  • IS-2-071: Yu Mitsuzumi (NTT Corporation / Kyoto University)*; Akisato Kimura (NTT Corporation); Hisashi Kashima (Kyoto University), “Understanding and Improving Source-free Domain Adaptation from a Theoretical Perspective”
  • IS-2-072: Takashi Nishimoto (OMRON Corporation)*; Masanori Hashizaki (OMRON Corporation); Koichi Kinoshita (OMRON Corporation), “良品特徴分布に基づく領域分割による少数ショット異常検出 (Few-shot Anomaly Detection via Area Separation Based on the Distribution of Normal Features)”
  • IS-2-073: 福田拓真, 計良宥志, 川本一彦 (千葉大), “アダプタネットワークのモデルマージによるスケーラブルなクラス増分学習”
  • IS-2-074: 冨田真央 (東工大), 佐藤育郎 (デンソーアイティーラボラトリ, 東工大), 川上玲, 井上中順 (東工大), 池畑諭 (NII, 東工大), 田中正行 (東工大), “深層ネットワークのランダム層選択による転移学習”
  • IS-2-075: 堀畑天, 吉田壮, 棟安実治 (関西大), “地理的な変化を考慮したドメイン適応”
  • IS-2-076: 森本文哉, 小野智司 (鹿児島大), “微小なワンショット再攻撃による敵対的サンプルの矯正に関する研究”
  • IS-2-077: 金岡大樹, 福田有輝也, 田向権 (九工大), “潜在拡散モデルによる画風の模倣を防ぐ敵対的摂動の高速生成”
  • IS-2-078: Masaya Fukui (Chubu University)*; Takanori Ogata (Chubu University); Tsubasa Hirakawa (Chubu University); Takayoshi Yamashita (Chubu University); Hironobu Fujiyoshi (Chubu Univ.), “Wavelet Components Transformer”
  • IS-2-079: 神谷涼, 川本一彦, 計良宥志 (千葉大), “画像言語モデルにおけるプロンプト学習の説明”
  • IS-2-080: Kyohei Kamikawa (Hokkaido university); Keisuke Maeda (Hokkaido University); Takahiro Ogawa (Hokkaido University); Miki Haseyama (Hokkaido University)*, “Machine Unlearning Framework based on Aggregation of Gaussian Process-based Submodels”
  • IS-2-081: Kosei Sumida (Nagoya University)*; Noriaki Hashimoto (RIKEN); Daiki Miwa (Nagoya Institute of Technology); Hiroyuki Hanada (RIKEN); Hiroaki Miyoshi (Kurume University); Jun Sakuma (Tokyo Institute of Technology / RIKEN AIP); Hidekata Hontani (Nagoya Institute of Technology); Koichi Ohshima (Department of Pathology,School of Medicine, Kurume University); Ichiro Takeuchi (Nagoya University), “マルチインスタンス学習におけるアテンションに対する信頼性の定量化 (Quantifying the reliability of attention in multiple instance learning)”
  • IS-2-082: 中溝雄斗, 柳井啓司 (電通大), “Act-ChatGPT: 動作特徴を用いた対話型ビデオ理解モデル”
  • IS-2-083: Yanan Wang (KDDI Research)*; Shuichiro Haruta (KDDI Research, Inc.); Donghuo Zeng (KDDI Research); Julio Vizcarra (KDDI Research); Mori Kurokawa (KDDI Research, Inc.), “Top-down Activity Representation Learning for Video Question Answering”
  • IS-2-084: 横山晃士, 山本豪志朗, 劉暢, 御手洗彰, 岸本和昌, 森由希子, 黒田知宏 (京大), “Variational Autoencoderを用いた手術室監視カメラ映像に映る個人行動の異常値推定とクラスタリングの試み”
  • IS-2-085: yuki hirai (Tokyo University of Science)*; Yota Yamamoto (Tokyo University of Science); Ryosuke Furuta (The University of Tokyo); Yukinobu Taniguchi (Tokyo University of Science), “少量の教師ラベルと標準作業書を用いた弱半教師あり行動分割 (Weakly Semi-Supervised Action Segmentation using Few-shot Labels and Standard Operating Procedures)”
  • IS-2-086: Taiga Yamane (NTT Corporation)*; Satoshi Suzuki (NTT Computer and Data Science Laboratories / The University of Electro-Communications); Ryo Masumura (NTT Corporation); Shotaro Tora (NTT Corporation), “Same View AttentionとDifferent View Attentionを用いたマルチビュー時空間行動認識 (RGB-based Multi-View Spatio-Temporal Action Recognition with Transformer)”
  • IS-2-087: Hirofumi Abe (NTT Corporation)*; Toshihiko Nishimura (NTT Corporation); Kazuhiko Murasaki (NTT Corporation); Taiga Yoshida (NTT Corporation); Ryuichi Tanida (NTT Corporation), “メタバース空間生成時における窓枠を手掛かりとした窓ガラスの認識と補完 (Recognition and completion of window panes using window frames as cues during metaverse space generation)”
  • IS-2-088: Kanon Sato (Keio University)*; Takuya Nakabayashi (Keio University); Masahiro Yamaguchi (NEC Corporation); Kyota Higa (NEC Corporation); Ryo Fujiwara (NEC Corporation); Hideo Saito (Keio University), “イベントカメラによるスポーツ競技のボール軌跡推定 (Ball Trajectory Estimation in Sports Using Event Cameras)”
  • IS-2-089: 澤田知也, 桂井麻里衣 (同志社大), “ファッションスタイルを考慮した衣服特徴抽出器の構築”
  • IS-2-090: 濱田龍之介, 峰松翼, 唐成, 島田敬士 (九大), “変化検出ViTのattentionへのadapter導入に関する分析”
  • IS-2-091: 平尾努 (NTT), 小林尚輝, 上垣外英剛, 奥村学 (東工大), 木村昭悟 (NTT), “マルチモーダル要約における談話構造の有効性について”
  • IS-2-092: Zhaoyi An (Tokyo Institute of Technology); Rei Kawakami (Tokyo Institute of Technology)*, “Generating Sign Language Poses with Pretrained Large Language Model”
  • IS-2-093: 梅村歩, 吉田和哉 (東北大), 櫻田健, 大西正輝 (産総研), “地形の周波数特性に着目した大域的特徴量による場所認識及び踏破性解析”
  • IS-2-094: 村田晴彦 (名城大), 南野尚樹 (熊本大), 上田貴志 (基礎生物学研究所), 近藤洋平 (京都大学), 堀田一弘 (名城大), “チャンネル情報を強化したVideo Vision Transformerによるゼニゴケ動画像の分類”
  • IS-2-095: 山本陸, 武村紀子 (九工大), “角度による距離学習を用いた基本感情に基づく複合感情推定”
  • IS-2-096: 大竹ひな, 福原吉博 (早大, cvpaper.challenge), 久保谷善記 (cvpaper.challenge), 森島繁生 (早大), “基盤モデルを用いた生成画像検出器の汎化性能の分析”
  • IS-2-097: Megumi Kobayashi (ZOZO, Inc.)*; Ippei Yoshimoto (ZOZO, Inc.); Tomoya Kose (ex-ZOZO, Inc.), “Moon & Spencer のAesthetic Measureを用いたファッションのカラー・コーディネート評価の検討 (The Moon-Spencer Aesthetic Measure for color harmony in fashion)”
  • IS-2-098: Naoya Nakajima (LY Corporation)*; Yuchi Ishikawa (LY Corporation); Masayoshi Kondo (LY Corp.), “動画クラスタリングのためのDINOの動画への拡張の検討 (Exploring the Extension of DINO for Video Clustering)”
  • IS-2-099: Itthisak Phueaksri (Nagoya University)*; Marc A. Kastner (Hiroshima City University); Yasutomo Kawanishi (RIKEN); Takahiro Komamizu (Nagoya University); Ichiro Ide (Nagoya University), “Toward Visual Storytelling using Scene-Graph Contexts”
  • IS-2-100: Haruto Izumi (Kumamoto University)*; Masahiro Migita (Kumamoto University); Masashi Toda (Kumamoto University); Masahiko Itoh (Kumamoto University), “深層学習による画像インペインティングを用いた古文書画像中における紙背文書の復元 (Restoration of “Shihai-monjyo” in ancient document images using image inpainting with deep learning)”
  • IS-2-101: Takumi Katagiri (Tokyo University of Science)*; Yota Yamamoto (Tokyo University of Science); Go Irie (Tokyo University of Science); Yoko Sogabe ( NTT Corporation); Ayumi Matsumoto (NTT Corporation); Masaki Kitahara (NTT Corporation); Yukinobu Taniguchi (Tokyo University of Science), “マルチスペクトル映像を用いた非接触酸素飽和度推定 (Non-contact oxygen saturation estimation using multispectral video)”
  • IS-2-102: Ryo Moriyama (Aoyama Gakuin University)*; Naoshi Kaneko (Tokyo Denki University); Kazuhiko Sumi (Aoyama Gakuin University), “異常範囲の指定可能なAction Promptによる再学習不要の異常行動検知 (Anomaly Detection without re-learning based on Action Prompt specifying the range of anomaly)”
  • IS-2-103: 櫻井快勢, 武富貴史 (サイバーエージェント), “異方性フィルタとベクトル探索による非定常テクスチャ合成法の再考”
  • IS-2-104: 石林, 松藤憲吾, 川原僚 (九工大), 岡部孝弘 (岡山大), “蛍光物体を含むシーンの任意視点・任意光源色画像の生成”
  • IS-2-105: 住野奏, 原田翔太, 満上育久 (広島市大), 佐川立昌 (産総研), “直感的な表情編集が可能な顔映像生成”
  • IS-2-106: 紺谷精一, 黒住隆行, 深津真二 (NTT), “大規模野外空間へのNeRF適用に関する検討”
  • IS-2-107: Noriyuki Abe (TOPPAN Digital Inc.)*; Shuji Sakai (TOPPAN Digital Inc.), “Latent Diffusion Modelsに基づくコミック着色 (Comic Colorization based on Latent Diffusion Models)”
  • IS-2-108: 早川恭平 (東工大), DongHyun Hwang (NAVER Cloud), Chen-Chieh Liao, 小池英樹 (東工大), “拡散モデルを用いた一人称三次元姿勢推定の学習データ生成”
  • IS-2-109: Yudai Gondo (National Institute of Technology, Kurume College)*, “Improving sparsity of Convolutional Sparse Representation using a combination of a few dictionary filters”
  • IS-2-110: 福田有輝也 (九工大), 下田和, 山口光太 (サイバーエージェント), “Polygonによるテキストレイアウト制約に基づく画像生成”
  • IS-2-111: Jan Zdenek (CyberAgent)*; Wataru Shimoda (CyberAgent.Inc); Kota Yamaguchi (CyberAgent), “Erasing Scene Text with Foundation Models”
  • IS-2-112: 今井秀彦, 安部航太朗, 岩井儀雄, 青木工太 (鳥取大), “ピアノ演奏におけるU-Netと整数ウェーブレットによる高解像度未来予測映像生成法の検討”
  • IS-2-113: 入山太嗣, 星澤知宙, 小室孝 (埼玉大), “視点移動に伴う物体の見え方の自然さを考慮した視点補間画像生成”
  • IS-2-114: Diego Hernandez Rodriguez (Nara Institute of Science and Technology)*; Motoharu Sonogashira (RIKEN); Kazuya Kitano (Nara Institute of Science and Technology); Yuki Fujimura (Nara Institute of Science and Technology); Takuya Funatomi (Nara Institute of Science and Technology); Yasuhiro Mukaigawa (NAIST); Yasutomo Kawanishi (RIKEN), “Arbitrary Viewpoint Event Camera Simulation by Neural Radiance Fields”
  • IS-2-115: 野田栞穂, 堀田大地, 相澤清晴 (東大), “テキストと条件付けによる事前学習済み生成モデルを利用した画像の超圧縮”

16:20 - 18:20 Interactive session 2B (IS-2B) / Sponsor exhibition B (EX-B): 1F Exhibition Hall

  • EX-P1: 株式会社サイバーエージェント (CyberAgent, Inc.)
  • EX-P2: 株式会社日立製作所 (Hitachi, Ltd.)
  • EX-P3: HPCテック (HPCTECH)
  • EX-P4: 華為技術日本株式会社 (Huawei Technologies Japan K.K.)
  • EX-G1: 株式会社デンソーアイティ―ラボラトリ (DENSO IT Laboratory)
  • EX-G2: 株式会社センスタイムジャパン (Sense Time Japan Ltd.)
  • EX-G3: LINEヤフー株式会社 (LY Corporation)
  • EX-G4: オムロン株式会社 (OMRON Corporation)
  • EX-G5: キャディ株式会社 (CADDi Inc.)
  • EX-G6: 株式会社ZOZO NEXT (ZOZO NEXT, Inc.)
  • EX-G7: 株式会社BuySell Technologies (BuySell Technologies Co., Ltd.)
  • EX-G8: 株式会社ネットコンパス (NetCOMPASS Ltd.)
  • EX-G9: 日本電信電話株式会社(NTT R&D) (NIPPON TELEGRAPH AND TELEPHONE CORPORATION)
  • EX-G10: 株式会社メルカリ (Mercari, inc.)
  • EX-G11: Turing株式会社 (Turing Inc.)
  • EX-G12: 日産自動車株式会社 (Nissan Motor Co., Ltd.)
  • EX-G13: 株式会社東芝 (Toshiba corporation)
  • EX-G14: SB Intuitions株式会社 (SB Intuitions Corp.)
  • EX-G15: ダイキン工業株式会社 (DAIKIN INDUSTRIES, LTD.)
  • EX-G16: 株式会社NTTドコモ (NTT DOCOMO, INC.)
  • EX-G17: 株式会社tiwaki (tiwaki Co., Ltd.)
  • EX-G18: Sansan株式会社 (Sansan, Inc.)
  • EX-G19: Mantra株式会社 (Mantra Inc.)
  • EX-G20: 三菱重工業株式会社 (Mitsubishi Heavy Industries. Ltd.)
  • EX-G21: 日本電気株式会社 (NEC Corporation)
  • EX-G22: 住友重機械工業株式会社 (Sumitomo Heavy Industries, Ltd)
  • EX-G23: 株式会社本田技術研究所 (Honda R&D Co., Ltd.)
  • IT-05: Daichi Horita (Univ. of Tokyo), Naoto Inoue, Kotaro Kikuchi, Kota Yamaguchi (CyberAgent), Kiyoharu Aizawa (Univ. of Tokyo), “Retrieval-Augmented Layout Transformer for Content-Aware Layout Generation”, [CVPR]
  • IT-06: Tianwei Chen, Yusuke Hirota (Osaka Univ.), Mayu Otani (CyberAgent), Noa Garcia, Yuta Nakashima (Osaka Univ.), “Would Deep Generative Models Amplify Bias in Future Models?”, [CVPR]
  • IT-07: Kosuke Sumiyasu, Kazuhiko Kawamoto, Hiroshi Kera (Chiba Univ.), “Identifying Important Group of Pixels using Interactions”, [CVPR]
  • IT-08: Mikihiro Tanaka, Kent Fujiwara (LY), “Role-aware Interaction Generation from Textual Description”, [ICCV]
  • IT-09: Qing Yu, Mikihiro Tanaka, Kent Fujiwara (LY), “Exploring Vision Transformers for 3D Human Motion-Language Models with Motion Patches”, [CVPR]
  • IT-10: Jiaxuan Li, Duc Minh Vo (Univ. of Tokyo), Akihiro Sugimoto (NII), Hideki Nakayama (Univ. of Tokyo), “EVCap: Retrieval-Augmented Image Captioning with External Visual-Name Memory for Open-World Comprehension”, [CVPR]
  • OS-2D-01: Shogo Sato (NTT Corporation)*; Takuhiro Kaneko (NTT Corporation); Taiga Yoshida (NTT Corporation); Kazuhiko Murasaki (NTT Corporation); Ryuichi Tanida (NTT Corporation); Akisato Kimura (NTT Corporation), “Unsupervised Intrinsic Image Decomposition with LiDAR Intensity Enhanced Training”
  • OS-2D-02: Taro Togo (Hokkaido University)*; Ren Togo (Hokkaido University); Keisuke Maeda (Hokkaido University); Takahiro Ogawa (Hokkaido University); Miki Haseyama (Hokkaido University), “Refining Generative Class Incremental Learning Performance through Model Forgetting Strategies”
  • OS-2D-03: 東大樹, 松井勇佑 (東大), 牧淳人 (スウェーデン王立工科大), “ZoDi:拡散モデルに基づく画像変換を用いたゼロショットドメイン適応”
  • OS-2D-04: 江口達大, 竹崎隼平, 備瀬竜馬 (九大), “撮像条件情報を用いたガイダンスを導入した拡散モデルによる光超音波画像の画質改善”
  • OS-2D-05: 北沢一真 (筑波大), 青砥隆仁 (Optech Innovation), 池畑諭 (NII, 東工大), 髙谷剛志 (筑波大), “イベントカメラと運動光源を用いた法線推定”
  • OS-2D-06: 松本玲音 (九工大), 岡部孝弘 (岡山大), 川原僚 (九工大), “多焦点偏光画像群からの不透明微小物体の形状復元”
  • OS-2D-07: Shunta Kimura (Tokyo University of Science)*; Kodai Kawamura (Tokyo University of Science); Shunya Yamagami (Tokyo University of Science); Qing Yu (The University of Tokyo); Kiyoharu Aizawa (The University of Tokyo); Go Irie (Tokyo University of Science), “One-shot Test-Time Adaptation with Textual Inversion”
  • OS-2D-08: 篠田理沙 (京大), 塩原楓 (東大), “動物の顔認識に対する大規模データセット構築”
  • OS-2D-09: Yohanssen Pratama (Nara Institute of Science and Technology)*; Kazuya Kitano (Nara Institute of Science and Technology); Takahiro Kushida (Ritsumeikan University); Yuki Fujimura (Nara Institute of Science and Technology); Takuya Funatomi (Nara Institute of Science and Technology); Yasuhiro Mukaigawa (NAIST), “Pixel-Wise Material Classification Using Deep Learning by Utilizing Transient Responses”
  • OS-2D-10: Futa Kai Waseda (The University of Tokyo)*; Antonio Tejero-de-Pablos (CyberAgent), “How to Defend Image-Text Retrieval against Adversarial Attacks (How to Defend Image-Text Matching Tasks against Adversarial Attacks)”
  • IS-2-116: Yusuke Oumi (Keio University)*; YUTO SHIBATA (Keio university); Go Irie (Tokyo University of Science); Akisato Kimura (NTT Corporation); Yoshimitsu Aoki (Keio University); Mariko Isogawa (Keio University), “計測対象人物位置に頑健な音響情報を用いた三次元人物姿勢推定 (Acoustic-based 3D human pose estimation which robust to human position)”
  • IS-2-117: Yaozong Gan (Hokkaido University)*; Guang Li (Hokkaido University); Ren Togo (Hokkaido University); Keisuke Maeda (Hokkaido University); Takahiro Ogawa (Hokkaido University); Miki Haseyama (Hokkaido University), “Fine-grained Traffic Sign Recognition Via Cross-domain Few-shot In-context Learning”
  • IS-2-118: Ziwen Lan (Hokkaido University)*; Keisuke Maeda (Hokkaido University); Takahiro Ogawa (Hokkaido University); Miki Haseyama (Hokkaido University), “Adversarial Attack Focused on Manipulating Semantic Information for Personalized Text-to-Image Diffusion Models”
  • IS-2-119: 坂野達郎, 武縄瑞基, Leslie Wöhler (東大), 池畑諭 (NII, 東工大, 東大), 相澤清晴 (東大), “実世界360度映像とCityGMLを融合したバーチャル空間の構築”
  • IS-2-120: YINGXUAN LI (The University of Tokyo)*; Ryota Hinami (Mantra Inc.); Kiyoharu Aizawa (The University of Tokyo); Yusuke Matsui (The University of Tokyo), “Zero-Shot Character Identification and Speaker Prediction in Comics via Iterative Multimodal Fusion”
  • IS-2-121: 七田亮, 藤後廉, 前田圭介, 小川貴弘, 長谷山美紀 (北大), “深層距離学習に基づく画像記憶性スコアの制御機構を導入したテキストからの画像生成に関する検討”
  • IS-2-122: Kotaro Kikuchi (CyberAgent)*; Naoto Inoue (CyberAgent); Mayu Otani (CyberAgent); Edgar Simo-Serra (Waseda University); Kota Yamaguchi (CyberAgent), “Multimodal Markup Language Models for Graphic Design Completion”
  • IS-2-123: 熊谷香織 (NTT), 清水隆史 (警察大学校), 高木基宏, 瀬下仁志 (NTT), “実世界の環境情報と人物属性を考慮する行動シミュレーション手法の検討”
  • IS-2-124: Yusuke Marumo (Chiba University)*; Kazuhiko Kawamoto (Chiba University); Hiroshi Kera (Chiba University), “Matching Non-Identical Objects”
  • IS-2-125: 征樹 金川 (筑波大学)*; 脩平 高畑 (藍野大学); 慧 寺山 (横浜市立大学); Yoshihiro Kuroda (University of Tsukuba); 直人 家永 (筑波大学), “小児の特徴を考慮したデータ拡張による書字検出 (Spatially unbalanced handwriting detection)”
  • IS-2-126: Yusei Shintani (Kumamoto University)*; Gou Koutaki (Kumamoto University), “ハッシュドテンプレート:特定物体認識のための高精度かつ高速な手法 (Hashed templates:Highly accurate and fast specific object recognition method)”
  • IS-2-127: 田村駿弥, 下西慶, 近藤一晃, 中村裕一 (京大), “意図を考慮した組み立て作業者の手の遷移位置予測”
  • IS-2-128: 齋藤健太, 数藤恭子 (東邦大), “物体候補領域の超解像に基づく低解像度小物体検出”
  • IS-2-129: Momoe Yamane (Keio University)*, “Occlusion Free Mutli-Object Tracking With Multiple Camera”
  • IS-2-130: Soyoko Otsuki (Keio University)*; Umihiro Kamoto (Panasonic Connect Co., Ltd.); Takeshi Watanabe (Panasonic Connect Co., Ltd.); Takeshi Fujimatsu (Panasonic Connect Co., Ltd); Yoshimitsu Aoki (Keio University), “点群を利用した弱教師あり映像異常検知 (Weakly Supervised Video Anomaly Detection Using Point Cloud)”
  • IS-2-131: Yudai Ishihara (Kyushu University, Japan); Kohei Inoue (Kyushu University, Japan); Kenji Hara (Kyushu University, Japan)*, “Yin-Yangグリッドを用いた全天球スーパーピクセル分割 (360-Degree Image Superpixel Segmentation Using Yin-Yang Grid)”
  • IS-2-132: Atsuyuki Miyai (The University of Tokyo)*; Jingkang Yang (Nanyang Technological University); Jingyang Zhang (Duke University); Yifei Ming (University of Wisconsin-Madison); Qing Yu (The University of Tokyo); Go Irie (Tokyo University of Science); Yixuan Li (University of Wisconsin-Madison); Hai Li (Duke University); Ziwei Liu (Nanyang Technological University); Kiyoharu Aizawa (The University of Tokyo), “Unsolvable Problem Detection: Towards Trustworthy Vision-Language Models (Exploring Unsolvable Problem Detection toward Reliable Vision Language Models)”
  • IS-2-133: Shogo Iwakata (Waseda university)*; Ryosuke Oshima (Waseda University); Hideki Tsunashima (Waseda University); Fumiya Matsuzawa (Tsukuba University); Yue Qiu (National Institute of Advanced Industrial Science and Technology (AIST)); Hirokatsu Kataoka (National Institute of Advanced Industrial Science and Technology (AIST)); Shigeo Morishima (Waseda Research Institute for Science and Engineering), “A New Benchmark for 3D Visual Grounding using Robotic Viewpoints”
  • IS-2-134: Chihaya Matsuhira (Nagoya University)*; Marc A. Kastner (Hiroshima City University); Takahiro Komamizu (Nagoya University); Takatsugu Hirayama (University of Human Environments); Ichiro Ide (Nagoya University), “語感の定量化に向けた画像に写る概念に対する視覚的印象の推定 (Estimating the visual impression of a concept for quantifying human perception of nonwords)”
  • IS-2-135: Taichi Nishimura (LY Corporation)*, “Lighthouse: 再現可能で使いやすい動画区間検索のライブラリ (Lighthouse: An easy-to-use, reproducible library for video moment retrieval)”
  • IS-2-136: 仁田智也 (東芝), 玉木徹 (名工大), “動画の説明文生成における長さ制御のための埋め込みとその解析”
  • IS-2-137: Riku Inoue, Yuta Goto (Tokyo Univ. of Science), Takashi Shibata (NEC), Yukinobu Taniguchi, Go Irie (Tokyo Univ. of Science), “Learning to “Escape” Visual Concepts”
  • IS-2-138: 池田昂太郎, 松平茅隼, 加藤大貴 (名大), カストナーマークアウレル (広島市大, 名大), 平山高嗣 (人間環境大, 名大), 駒水孝裕, 井手一郎 (名大), “歌唱時の口唇形状の類似性を考慮した歌詞の自動翻訳の検討”
  • IS-2-139: 貝津俊一, 中村和晃 (東京理科大), “テキストガイド付き画像変換モデルを利用したImage Captioningの性能改善の試み”
  • IS-2-140: 芦原新太郎, 徳永旭将 (九工大), “EVSによる共振撮影を利用した透明物体のインスタンスセグメンテーションの検討”
  • IS-2-141: Ryo Fujii (Keio University)*; Ryo Hachiuma (NVIDIA); Hideo Saito (Keio University), “CrowdMAC: Masked Crowd Density Completion for Robust Crowd Density Forecasting”
  • IS-2-142: 平岡翼, 原田翔太, 満上育久 (広島市大), “歩容解析のためのNeRFを用いた歩行映像生成”
  • IS-2-143: 高市将吾 (阪大), 青木工太 (鳥取大), 西野 (林) 美都子, 西野邦彦, 八木康史 (阪大), “薬剤耐性菌トモグラムからの粒子検出”
  • IS-2-144: Mohamad Ammar Alsherfawi Aljazaerly (Osaka University)*; Prof. Yasushi Yagi (Osaka University), “Human Model-Guided View Morphing for Clothed Gait Silhouettes”
  • IS-2-145: 日向寺拓海, 帖地俊平, 小篠裕子 (東京電機大), “RGB画像から再構築したHS画像を用いた生体認証システム”
  • IS-2-146: Yusuke Fujisaka (CyberAgent,Inc.)*, “サイバーエージェントのメディアサービスにおけるマルチメディアコンテンツ健全化への取り組み (Works for Safeguarding Multimedia Contents on Media Services in CyberAgent)”
  • IS-2-147: Shuntaro Masuda (The University of Tokyo)*; Toshihiko Yamasaki (The University of Tokyo), “Transformerおよびマルチモーダル特徴量を用いたSNSアカウントの人気の時系列予測 (Popularity Prediction of SNS Accounts using Transformer and Multimodal Features)”
  • IS-2-148: Kentaro Ogawa (LY Corporation)*; Kenshiro Ata (LY Corporation); Mariko Okugawa (LY Corporation); Akiko Kato (LY Corporation); Yuichiro Nishimaki (LY Corporation), “CLIPスコアによるワーカー評価 (Worker Evaluation in Crowdsourcing Using CLIP Scores)”
  • IS-2-149: Yamato Okamoto (Naver Cloud Corp.)*; Youngmin Baek ( Clova AI Research, NAVER Corp.); Geewook Kim (NAVER Corporation); Ryota Nakao (LINE WORKS Corp.); DongHyun Kim (NAVER Cloud); Moonbin Yim (Clova AI Research, NAVER Corp.); Seunghyun Park (Naver Cloud AI); Bado Lee (Clova AI Research, NAVER Corp.), “CREPE: Coordinate-Aware End-to-End Document Parser”
  • IS-2-150: 原口大地 (九大, サイバーエージェント), “非言語依存なフォントスタイル変換へ向けて”
  • IS-2-151: Yamato Kurihara (Tokyo Denki University)*; Wataru Ohyama (Tokyo Denki University); Eisaku Maeda (Tokyo Denki University), “ViT, CNNを利用したくずし字認識に関する一検討 (A Study on Kuzushiji Character Recognition Using ViT and CNN)”
  • IS-2-152: Nanami Kotani (The University of Tokyo)*; Yasuaki Monnai (The University of Tokyo), “心拍信号に基づくロックイン・サーモグラフィによる微小な体温変化の計測 (Measurement of minute changes in body temperature using lock-in thermography based on heart rate signals)”
  • IS-2-153: 沓澤岳, キムワンジク, 丸山迪代 (産総研), “深層学習を用いた生体データに基づく感情推定”
  • IS-2-154: 藤田倫弘, 川西康友 (理研), “Recurrent Graph Convolutional Networkによる人物3次元姿勢の逐次予測”
  • IS-2-155: 熊谷はるか, Leslie Wöhler (東大), 池畑諭 (NII), 相澤清晴 (東大), “顔交換でのアイデンティティに関する人と機械の評価の比較”
  • IS-2-156: Sota Oizumi (The University of Tokyo)*; Takuhiro Kaneko (NTT Corporation); Tatsuya Harada (The University of Tokyo / RIKEN), “MIMIC: Motion Imitation Model via In-Context Learning with LLMs”
  • IS-2-157: 沼田椋太郎 (無所属), 堀涼介 (慶大), 福原吉博 (早大), 五十川麻理子 (慶大), “ウェアラブルインソール型圧力センサを用いた人物の3次元姿勢推定”
  • IS-2-158: Taishu Arashima (Chiba University)*; hayato yamamuro (kyocera); Yuki Tomigami (kyocera); Yashuhiro Fukui (kyocera); Kenji Kono (kyocera); Hiroshi Kera (Chiba University); Kazuhiko Kawamoto (Chiba University), “一人称視点2次元骨格系列からの3次元人物軌跡予測 (Human Trajectory Prediction from first-person 2D skeletal series)”
  • IS-2-159: Hiroki Yazaki (Keio University)*; Ryosuke Hori (Keio University); Tomoya Matsubara (Keio University); Hideo Saito (Keio University), “二人称視点カメラによる事前3D環境を活用した一人称視点動画の推定 (Estimation of First-Person View Videos Utilizing Prior 3D Environment Captured by Second-Person Cameras)”
  • IS-2-160: Takayuki Katsuki (IBM Research - Tokyo)*; haoxiang qiu (IBM); Tomoya Sakai (IBM Research - Tokyo); Takayuki Osogami (IBM Research - Tokyo); Tadanobu Inoue (IBM Research); Daiki Kimura (IBM Research); A. Cristiano I. Malossi (IBM Research - Zurich), “Domain-adaptive Instance Segmentation for Visual Inspection from Civil Infrastructure Images”
  • IS-2-161: Tomohiro Suzuki (Nagoya University)*; Tanaka Ryota (Nagoya university); Kazuya Takeda (Nagoya University); Keisuke Fujii (Nagoya University / RIKEN), “単眼3次元姿勢推定のスポーツ動作への教師なし最適化 (Unsupervised fine-tuning of the monocular 3D pose estimation model for sports motion)”
  • IS-2-162: Yukino Tsuzuki (Yachiyo Engineering Co.,Ltd.)*; Ryuto Yoshida (Yachiyo Engineering Co.,Ltd.); Junichi Okubo (Yachiyo Engineering Co.,Ltd.); Junichiro Fujii (Yachiyo Engineering Co.,Ltd.); Masahiro Okano (Yachiyo Engineering Co., Ltd.); Riku Ogata (Yachiyo Engineering Co.,Ltd.); Takayoshi Yamashita (Chubu University), “Ensemble PatchCoreとSQ-VAEによる多段階異常検知 (Multi-step Anomaly Detection with Ensemble PatchCore and SQ-VAE)”
  • IS-2-163: 古家龍磨, 武村紀子 (九工大), “ランキング学習を用いたフィギュアスケート演技構成点の推定”
  • IS-2-164: 井上睦月 (阪公大), 漆原尚希 (阪府大), 井上勝文, 吉岡理文, 高尾理樹夫, 田中美成 (阪公大), “病院食における残食量評価に関する検討”
  • IS-2-165: Yuki Hirakawa (ZOZO Research)*; Kazuya Morishita (ZOZO Research); Takashi Wada (ZOZO Research); Ryotaro Shimizu (ZOZO Research); Takuya Furusawa (ZOZO Research); Sai Htaung Kham (ZOZO Research); Yuki Saito (ZOZO Research), “大規模視覚言語モデルを用いた「似合う」の自動評価法 (Automatic Evaluation Method for Visual Compatibility using Large-scale Vision Language Models)”
  • IS-2-166: 山岸峻造, 謝淳 (筑波大), 宍戸英彦 (創価大), 北原格 (筑波大), “パンチルトズーム映像による広範囲を移動する選手の位置推定手法”
  • IS-2-167: Hinako Mitsuoka (Meijo University)*; Kazuhiro Hotta (Meijo University), “Feedback Formerを用いた細胞画像セグメンテーションの精度向上 (Accuracy Improvement of Cell Image Segmentation Using Feedback Former)”
  • IS-2-168: 大橋智哉, 藤村友貴, 舩冨卓哉, 向川康博 (奈良先端大), Nath Sristilekha, 奥田覚 (金沢大), “ニューラル場による共焦点画像の奥行補間”
  • IS-2-169: 小野木次郎, 横田達也, 本谷秀堅 (名工大), “事後確率サンプリングとProgressive Mask Refinementによる分布のシフトに頑健な異常検知”
  • IS-2-170: 設楽裕海, 三浦幹太, 石井琢郎, 伊藤康一, 青木孝文, 西條芳文 (東北大), 大宮淳 (コニカミノルタ), “単一平面波イメージングにおける超音波画像の品質改善とその性能評価”
  • IS-2-171: Ryo Fujii (Keio University)*; Hideo Saito (Keio University); Hiroki Kajita (Keio University), “EgoSurgery: A Dataset for Surgical Video Understanding from Egocentric Open Surgery Videos ({EgoSurgery: A Dataset for Surgical Video Understanding from Egocentric Open Surgery Videos)”
  • IS-2-172: 矢野友理, 小森達貴, 西川広記, 谷口一徹, 尾上孝雄 (阪大), “転移学習と前処理を用いた尿中有形成分の検出”
  • IS-2-173: Yu Yamaoka (Osaka University)*; Weng Ian Chan (Osaka University); Shigeto Seno (Osaka University); Hideo Matsuda (Osaka University), “Weakly Supervised Learning from Similarity Proportion Loss for Classification in the Skeletal Muscle Recovery Process”
  • IS-2-174: 佐々木桂太, 西川広記, 谷口一徹, 尾上孝雄 (阪大), “アンサンブル学習を用いた尿中有形成分の検出高精度化”
  • IS-2-175: Kenji Fujimoto (Hirosaki University)*; Shigeto Seno (Osaka University); Hironori Shigeta (Osaka University); Yutaka Uchida (Osaka University); Masaru Ishii (Osaka University); Yoshinori Tamada (Hirosaki University); Hideo Matsuda (Osaka University), “経時観測蛍光画像における細胞同士の重畳を考慮した細胞追跡手法 (Overlap-Aware Cell Tracker for Time-Lapse Fluorescence Microscopy)”
  • IS-2-176: 加藤優奈, 五十川麻理子 (慶大), 森尚平 (グラーツ工科大), 斎藤英雄, 梶田大樹, 高詰佳史 (慶大), “マルチカメラ映像の自由視点技術による術野を確認しやすい手術映像生成”
  • IS-2-177: 杉谷祐介 (岡山大), 利田賢哉, 伊藤心二, 吉住朋晴 (九大), 諸岡健一 (熊本大), “術前血液検査および術前CT検査を用いた肝細胞癌の病理所見の予測”
  • IS-2-178: 田原聖士, 備瀬竜馬 (九大), “異なるスケール間での画像位置合わせ手法の検討”
  • IS-2-179: 宝満竜一, 内田誠一 (九大), 田中聖人 (京都第二赤十字病院), 早志英朗 (阪大), “相対ラベルを利用したクラス分類のための最適輸送損失”
  • IS-2-180: Shunta Matsumoto (Nagasaki university)*; Keita Takeda (Nagasaki University); Tomoya Sakai (Nagasaki University); Eiji Mitate (Kanazawa Medical University), “回転同変な深層学習モデルは口腔細胞診に有効か? (Experimental Verification of the Effectiveness of Equivariant Deep Learning Models for Oral Cytology)”
  • IS-2-181: 近藤涼太, 田崎豪 (名城大), “異常検出を利用した整理対象物体の検出”
  • IS-2-182: 水野智貴, 矢橋和也, 田崎豪 (名城大), “視点推定に基づくカメラアーム制御による物体姿勢推定精度の向上”
  • IS-2-183: Swe Nwe Nwe Htun (National Institute of Advanced Industrial Science and Technology)*; Shusaku Egami (National Institute of Advanced Industrial Science and Technology); Takanori Ugai (National Institute of Advanced Industrial Science and Technology; Fujitsu Limited); Yijun Duan (National Institute of Advanced Industrial Science and Technology); Ken Fukuda (National Institute of Advanced Industrial Science and Technology), “3D Spatial Grounding in Virtual Environments: A VirtualHome2KG Study”
  • IS-2-184: 三輪珠嶺, 大西正輝 (筑波大, 産総研), “目的地を考慮したデータ駆動型歩行者モデルの構築”
  • IS-2-185: 久保勇貴 (NTT), 志築文太郎 (筑波大), “装着型センサを用いた手形状深度画像再構成手法”
  • IS-2-186: 馬渕佑真, 小篠裕子 (電機大), “個人の視覚特性に合わせた画像強調エージェント”
  • IS-2-187: 平野稔祐, 小池英樹 (東工大), “AlchemyCode: 重ね合わせ可能な魔法陣風2Dマーカー”

19:00 - 21:00 Networking banquet: Hotel Nikko Kumamoto


Aug. 9th (Fri)

9:00 - 10:00 Keynote session: 4F Main Hall

10:10 - 11:40 Oral session 3A (OS-3A): 4F Main Hall

Session chair: Kazuki Kozuka (Panasonic)

  • OS-3A-01: 有川尚輝, 前田涼汰, 日浦慎作 (兵庫県立大), “偏光計測系と分類器の同時最適化による材質認識”
  • OS-3A-02: Shuhei M Yoshida (NEC Corporation)*; Takashi Shibata (NEC Corporation); Makoto Terao (NEC Corporation); Takayuki Okatani (Tohoku University/RIKEN AIP); Masashi Sugiyama (RIKEN/The University of Tokyo), “Action-Agnostic Point-Level Supervision for Temporal Action Detection”
  • OS-3A-03: Hodaka Kawachi (Osaka University)*; Tomoya Nakamura (Osaka University); Hajime Nagahara (Osaka University); Prof. Yasushi Yagi (Osaka University), “符号化開口と拡散モデルを用いた単一ボケ画像からの深度再構成 (Single-Image Depth from Defocus with Coded Aperture and Diffusion Posterior Sampling)”
  • OS-3A-04: Masatoshi Tateno (Institute of Industrial Science, The University of Tokyo)*; Takuma Yagi (National Institute of Advanced Industrial Science and Technology (AIST)); Ryosuke Furuta (The University of Tokyo); Yoichi Sato (University of Tokyo), “Learning Object States from Actions via Large Language Models”
  • OS-3A-05: YUTO SHIBATA (Keio university)*; Yasunori Kudo (Preferred Networks, Inc.); Yohei Sugawara (Preferred Networks, Inc.), “Anatomical 3D Style Transfer Enables Efficient Federated Learning with Extremely Low Communication Costs”
  • OS-3A-06: 松尾信之介 (九大), 末廣大貴 (横浜市大), 計良宥志 (千葉大), 内田誠一, 備瀬竜馬 (九大), “Prototypeに基づいたAttentionによるLearning from Label Proportions”
  • OS-3A-07: Kengo Ikeuchi (The University of Tokyo)*; Jiafeng Mao (The University of Tokyo); Qing Yu (The University of Tokyo); Go Irie (Tokyo University of Science); Kiyoharu Aizawa (The University of Tokyo), “追加学習された拡散モデルに対するメンバーシップ推論 (Membership inference against fine-tuned diffusion models)”
  • OS-3A-08: Sandra Zhang Ding (The University of Tokyo)*; Jiafeng Mao (The University of Tokyo); Kiyoharu Aizawa (The University of Tokyo), “Latent Optimization for Training-Free Sketch-Guided Diffusion”
  • OS-3A-09: Ryu Tadokoro (Tohoku University)*; Ryo Nakamura (Fukuoka University, National Institute of Advanced Industrial Science and Technology (AIST)); Ryosuke Yamada (University of Tsukuba, National Institute of Advanced Industrial Science and Technology (AIST)); Yuki M Asano (University of Amsterdam); Iro Laina (University of Oxford); Christian Rupprecht (University of Oxford); Nakamasa Inoue (Tokyo Institute of Technology); Rio Yokota (Tokyo Institute of Technology); Hirokatsu Kataoka (National Institute of Advanced Industrial Science and Technology (AIST)), “Scaling Backwards: Minimal Synthetic Pre-training?”
  • OS-3A-10: Go Ohtani (Keio University)*; Ryu Tadokoro (Tohoku University); Ryosuke Yamada (University of Tsukuba, National Institute of Advanced Industrial Science and Technology (AIST)); Yuki M Asano (University of Amsterdam); Iro Laina (University of Oxford); Christian Rupprecht (University of Oxford); Nakamasa Inoue (Tokyo Institute of Technology); Rio Yokota (Tokyo Institute of Technology); Hirokatsu Kataoka (National Institute of Advanced Industrial Science and Technology (AIST)); Yoshimitsu Aoki (Keio University), “画像超解像における学習データ構築の再考 (Rethinking Construction of Training Data in Image Super-Resolution)”

11:50 - 12:20 Work life balance session: 4F Main Hall

12:20 - 13:30 International events: 3F Conference Room B

12:20 - 13:05 Mentorship events: 3F Conference Room E

13:30 - 15:00 Interactive session 3A (IS-3A): 3F Conference Room A

  • OS-3A-01: 有川尚輝, 前田涼汰, 日浦慎作 (兵庫県立大), “偏光計測系と分類器の同時最適化による材質認識”
  • OS-3A-02: Shuhei M Yoshida (NEC Corporation)*; Takashi Shibata (NEC Corporation); Makoto Terao (NEC Corporation); Takayuki Okatani (Tohoku University/RIKEN AIP); Masashi Sugiyama (RIKEN/The University of Tokyo), “Action-Agnostic Point-Level Supervision for Temporal Action Detection”
  • OS-3A-03: Hodaka Kawachi (Osaka University)*; Tomoya Nakamura (Osaka University); Hajime Nagahara (Osaka University); Prof. Yasushi Yagi (Osaka University), “符号化開口と拡散モデルを用いた単一ボケ画像からの深度再構成 (Single-Image Depth from Defocus with Coded Aperture and Diffusion Posterior Sampling)”
  • OS-3A-04: Masatoshi Tateno (Institute of Industrial Science, The University of Tokyo)*; Takuma Yagi (National Institute of Advanced Industrial Science and Technology (AIST)); Ryosuke Furuta (The University of Tokyo); Yoichi Sato (University of Tokyo), “Learning Object States from Actions via Large Language Models”
  • OS-3A-05: YUTO SHIBATA (Keio university)*; Yasunori Kudo (Preferred Networks, Inc.); Yohei Sugawara (Preferred Networks, Inc.), “Anatomical 3D Style Transfer Enables Efficient Federated Learning with Extremely Low Communication Costs”
  • OS-3A-06: 松尾信之介 (九大), 末廣大貴 (横浜市大), 計良宥志 (千葉大), 内田誠一, 備瀬竜馬 (九大), “Prototypeに基づいたAttentionによるLearning from Label Proportions”
  • OS-3A-07: Kengo Ikeuchi (The University of Tokyo)*; Jiafeng Mao (The University of Tokyo); Qing Yu (The University of Tokyo); Go Irie (Tokyo University of Science); Kiyoharu Aizawa (The University of Tokyo), “追加学習された拡散モデルに対するメンバーシップ推論 (Membership inference against fine-tuned diffusion models)”
  • OS-3A-08: Sandra Zhang Ding (The University of Tokyo)*; Jiafeng Mao (The University of Tokyo); Kiyoharu Aizawa (The University of Tokyo), “Latent Optimization for Training-Free Sketch-Guided Diffusion”
  • OS-3A-09: Ryu Tadokoro (Tohoku University)*; Ryo Nakamura (Fukuoka University, National Institute of Advanced Industrial Science and Technology (AIST)); Ryosuke Yamada (University of Tsukuba, National Institute of Advanced Industrial Science and Technology (AIST)); Yuki M Asano (University of Amsterdam); Iro Laina (University of Oxford); Christian Rupprecht (University of Oxford); Nakamasa Inoue (Tokyo Institute of Technology); Rio Yokota (Tokyo Institute of Technology); Hirokatsu Kataoka (National Institute of Advanced Industrial Science and Technology (AIST)), “Scaling Backwards: Minimal Synthetic Pre-training?”
  • OS-3A-10: Go Ohtani (Keio University)*; Ryu Tadokoro (Tohoku University); Ryosuke Yamada (University of Tsukuba, National Institute of Advanced Industrial Science and Technology (AIST)); Yuki M Asano (University of Amsterdam); Iro Laina (University of Oxford); Christian Rupprecht (University of Oxford); Nakamasa Inoue (Tokyo Institute of Technology); Rio Yokota (Tokyo Institute of Technology); Hirokatsu Kataoka (National Institute of Advanced Industrial Science and Technology (AIST)); Yoshimitsu Aoki (Keio University), “画像超解像における学習データ構築の再考 (Rethinking Construction of Training Data in Image Super-Resolution)”
  • IS-3-W01~W04: MIRU2024 Wakate Program participants, “若手プログラム成果報告 (Report on the MIRU2024 Wakate Program)”
  • IS-3-001: 大関一輝 (慶大), 園山昌司 (小松製作所), 青木義満 (慶大), “Geometricベースのセルフキャリブレーション: 建設環境下における重機搭載カメラ自動校正の実現”
  • IS-3-002: 鈴木拓実, 伊藤颯汰, 加藤邦人 (岐阜大), 相澤宏旭 (広島大), “LSegのラベル予測確率分布を用いた特徴場の学習法”
  • IS-3-003: 金佑錫 (東大), 吹上大樹 (NTT), 大石岳史 (東大), “反射および屈折を考慮したニューラル放射輝度場”
  • IS-3-004: 中川俊輔, 川原僚 (九工大), 岡部孝弘 (岡山大), “偏光ライトフィールドに基づく鏡面物体の形状復元”
  • IS-3-005: Tomoki Inoue (Nagoya University)*; Keita Takahashi (Nagoya University); Yuya Ishikawa (Nagoya University); Shuji Habuchi (Nagoya University); Chihiro Tsutake (Nagoya University); Toshiaki Fujii (Nagoya Univ.); Hajime Nagahara (Osaka University), “自己教師型学習に基づく光線空間の符号化撮像 (Self-Supervised Approach to Coded Light-Field Acquisition)”
  • IS-3-006: Kenji Doi (LY Corporation)*; Shuntaro Okada (LY corporation); Ryota Yoshihashi (LY Corporation); Hirokatsu Kataoka (LY Cooperation), “Real-SRGD: 分類器無しガイダンスによる実世界超解像向け拡散モデルの画像品質改善 (Real-SRGD: Enhancing Real-World Image Super-Resolution with Classifier-Free Guided Diffusion)”
  • IS-3-007: Suzan J Kessy (Nara Institute of Science and Technology)*; Takuya Funatomi (Nara Institute of Science and Technology); Kazuya Kitano (Nara Institute of Science and Technology); Yuki Fujimura (Nara Institute of Science and Technology); Takahiro Kushida (Ritsumeikan University); Guillaume Caron (Universite de Picardie Jules Verne); El Mustapha Mouaddib (Universite de Picardie Jules Verne); Yasuhiro Mukaigawa (NAIST), “Mitigating Temporal Illumination Variation in Whisk-broom Hyperspectral Imaging using Dual-Perpendicular Scans”
  • IS-3-008: 羽渕柊志, 高橋桂太, 都竹千尋, 藤井俊彰 (名大), 長原一 (阪大), “符号化開口とイベントによる光線空間の高効率撮像”
  • IS-3-009: 久本直毅, 中田健太, 前田涼汰, 日浦慎作 (兵庫県立大), “単一光子検出器を用いた散乱媒体下でのNLOSイメージング”
  • IS-3-010: 吉田百花, 川原僚 (九工大), 岡部孝弘 (岡山大), “偏光と陰に基づく屈折率未知のワンショット法線推定”
  • IS-3-011: 坂本大地, 西川由馬, 坂上文彦, 佐藤淳 (名工大), “繊維製品のキズ検査のための近接光源照度差ステレオにおける照明最適化の検討”
  • IS-3-012: 松下侑聖, 菅谷保之 (豊橋技科大), “直交射影に基づく点特徴と線特徴を用いたハイブリッドなカメラ姿勢推定”
  • IS-3-013: Ali Caglayan (National Institute of Advanced Industrial Science and Technologhy (AIST), Tokyo, Japan); Nevrez Imamoglu (AIST)*; Oguzhan Guclu (Ahi Evran University); Ali Osman Serhatoglu (Hacettepe University); Ahmet Burak Can (Hacettepe University), “Attention Guided Odometry: Enchancing RGB-D SLAM with Task-Specific Network Attention”
  • IS-3-014: Shengze Zhong (CyberAgent)*; Takafumi Taketomi (CyberAgent), “Articulated Gaussian Splatting via GridShift”
  • IS-3-015: 上田栞, 斎藤英雄 (慶大), 森尚平 (グラーツ工科大), “合成ぼけ画像評価を用いた多層画像生成法”
  • IS-3-016: Kota Shinjo (Toyota Motor Corporation)*; Takayuki Kanai (Toyota Motor Corporation); Yuto Mori (Toyota Motor Corporation), “人体骨格推定を用いた単眼深度推定器のスケール復元 (Scale Recovery of Monocular Depth Estimator Using Human Pose Estimation)”
  • IS-3-017: Li Peizhao, 遠里由佳子 (立命館大), “特徴点マッチングを用いた画像処理によるマウス脳形状の三次元モデルの構築”
  • IS-3-018: Kazuto Ichimaru (Fujitsu Defense & National Security, Ltd.)*; takaki ikeda (kyushu university); Diego Thomas (Kyushu University); Takafumi Iwaguchi (Kyushu Univ.); Hiroshi Kawasaki (Kyushu univ.), “Neural Active Structure-from-Motion”
  • IS-3-019: 深井高輝, 山藤浩明, 大倉史生 (阪大), Heng Guo, Yufei Han (Beijing Univ. of Posts and Telecommunications), 松下康之 (阪大), “多視点カラー画像と偏光情報を組み合わせた信頼性に基づく高精細な3次元形状復元”
  • IS-3-020: 大川快 (東工大), 櫻田健 (産総研), 横田理央 (東工大), “ユークリッド距離による拘束条件を用いた密なバンドル調整”
  • IS-3-021: Takuto Nishio (Nagoya University)*; Chihiro Tsutake (Nagoya University); Keita Takahashi (Nagoya University); Toshiaki Fujii (Nagoya Univ.), “Warm-Start NeRF:NeRFに基づく光線空間の学習 における汎化型エンコーダを用いた高速化 (Warm-Start NeRF: Acceleration Using a Generalization Encoder in Learning Light Fields Based on NeRF)”
  • IS-3-022: Takeshi Endo (Hitachi, Ltd.)*, “視差算出におけるマッチングコストの再考 (Rethinking Matching Cost in Disparity Estimation)”
  • IS-3-023: 野口憲人, 北田裕之, 奥山隆文, 武田知典 (NTT), “Dynamic NeRFにおける未知の時刻に対する推論の性能評価”
  • IS-3-024: 尾﨑翠 (京都女子大, 奈良先端大), 久保孝富, 中島新菜, 宮井菜名子, 丸野由希 (奈良先端大), 永澤美保 (麻布大), “四足歩行動物に対する多個体3D姿勢追跡”
  • IS-3-025: Kai Kohyama (Keio University)*; Shintaro Shiba (Keio University); Yoshimitsu Aoki (Keio University), “イベントカメラによる三次元人体スキャンにおける三次元表現の検討 (A Study on Different 3D Representations for Event-based 3D Human Scan)”
  • IS-3-026: 金田綾乃, 櫻井快勢, 武富貴史 (サイバーエージェント), “多視点動画からの一貫した三次元顔メッシュ生成手法の検証と性能改善の検討”
  • IS-3-027: 青嶋雄大, 西村太一, 近藤雅芳 (LINEヤフー), “動画生成における文字崩れの評価のためのデータセットと評価指標の提案”
  • IS-3-028: 高橋聡太, 古川優汰, 森稔 (神奈川工科大), “スケジューリング機能を導入したデータ拡張による知識蒸留の改善”
  • IS-3-029: 玉山敦也 (東工大), 佐藤育郎 (デンソーアイティーラボラトリ), 池畑諭 (NII), “運転負荷予測のための走行画像データセット構築”
  • IS-3-030: 大平都雲, 西口敏司 (阪工大), 豊浦正広 (山梨大), “画像生成AIを利用した眼底画像のデータ拡張”
  • IS-3-031: Rebeka Sultana (Tokyo University of Agriculture and Technology)*; Hibiki Horibe (Tokyo University of Agriculture and Technology); Tomoaki Murakami (Tokyo University of Agriculture and Technology); Ikuko Shimizu (Tokyo University of Agriculture and Technology), “Cancer Cytoplasm Segmentation from Cell Image Based on Transfer Learning”
  • IS-3-032: 奥田萌莉, 石澤秀紘, 大島裕明 (兵庫県立大), “コウキクサの成長率推定:葉の領域認識と葉の外形的特徴への着目を組み合わせた手法”
  • IS-3-033: 李錚, 櫛田貴弘, 田中賢一郎 (立命館大), “複素ニューラルネットワークを用いたToF計測における霧の影響除去”
  • IS-3-034: Yuiko Sakuma (Sony Group Corporation)*; Masakazu Yoshimura (Sony Group Corporation); Junji Otsuka (Sony Group Corporation); Atsushi Irie (Sony Group Corporation); Takeshi Ohashi (Sony Group Corporation), “Mixed-precision Supernet Training from Vision Foundation Models using Low Rank Adapter”
  • IS-3-035: Ryota Higashi (Wakayama university)*; Toshikazu Wada (Wakayama University), “Data Pruningにおける蒸留を用いた特徴空間の再構成 (Feature Space Reconstruction Using Knowledge Distillation in Data Pruning)”
  • IS-3-036: Ryosuke Imazu (Nagoya University)*; Chihiro Tsutake (Nagoya University); Keita Takahashi (Nagoya University); Toshiaki Fujii (Nagoya Univ.), “Mono+Sub:単眼画像と付加情報による光線空間符号化 (Mono+Sub: Compressing Light Field as Monocular Image and Subsidiary Data)”
  • IS-3-037: 許敬斌, 柳井啓司 (電通大), “視覚言語モデルを用いたパノプティックシーングラフ生成”
  • IS-3-038: 日比野祐樹, 川本一彦, 計良宥志 (千葉大), “モード接続経路におけるモデルの注目特徴の連続的変化”
  • IS-3-039: 佐藤史興, 早志英朗, 長原一 (阪大), “集合データを対象とした識別と生成のマルチタスク学習と信頼度較正への応用”
  • IS-3-040: 中尾亮, 坂井亮介, 白石壮馬 (NEC), “世界モデルにおける環境変化への効率的な適応”
  • IS-3-041: Xinyue Li (Ritsumeikan University)*; Jiaqing Liu (ritsumeikan); Yu Wang (Hitotsubashi University); Jien Kato (Kochi University of Technology), “Hypergraph-enhanced Spatio-Temporal Transformer for Nurse Activity Recognition”
  • IS-3-042: 古里和暉, 中西慶一, 徳永旭将 (九工大), “欠損補完に基づく画像異常検知に対してマスクサイズが与える影響の評価”
  • IS-3-043: Taiki Sekii (Cyberagent)*, “Flashback機構を用いたTransformersとMambaのメモリ効率化と高速化 (Memory Optimization and Acceleration of Transformers and Mamba via Flashback Mechanism)”
  • IS-3-044: 宮部大翔, 米田駿介, 井上路子, 西山正志 (鳥取大), “線対称サンプルを含む場合のクラスタリングのためのLine-symmetrical Sample k-means++の提案”
  • IS-3-045: Hayate Masuda (The University of Tokyo)*; Hiroaki Shiokawa (University of Tsukuba); Yusuke Matsui (The University of Tokyo), “グラフ最近傍探索のための再帰的部分グラフ量子化 (Recursive Subgraph Quantization for Approximate Nearest Neighbor Search)”
  • IS-3-046: 志久開人, 松尾信之介, 末廣大貴, 備瀬竜馬 (九大), “多数派クラスラベルからの学習を目的とした数え上げネットワーク”
  • IS-3-047: 和田浩武, 野村泰信, 中村晃大 (阪大), 遠藤卓行 (大阪刀根山医療センター), 八木康史, 中村亨 (阪大), “下肢マーカーレスモーションキャプチャーシステムを用いたパーキンソン病の疾患弁別と重症度推定”
  • IS-3-048: 重藤優太郎, 新保仁 (千葉工大, 理研), 吉川友也, 竹内彰一 (千葉工大), “ドメイン汎化学習のための軽量な損失関数”
  • IS-3-049: Lang Huang (The University of Tokyo)*; Toshihiko Yamasaki (The University of Tokyo), “Exploring Prediction Targets in Masked Image Modeling”
  • IS-3-050: Atsushi Katayama (NTT Corporation)*; Kazuhiko Murasaki (NTT Corporation); Ryuichi Tanida (NTT Corporation), “スパイキングニューラルネットワークを用いた自動概念生成 (Automatic Concept Generation Using Spiking Neural Networks)”
  • IS-3-051: 山内直也, 水野湧太, 本谷秀堅 (名工大), 横田達也 (名工大, 理化学研究所), “Polya-Gamma拡張に基づくテンソルネットワークロジスティック回帰のためのEMアルゴリズム”
  • IS-3-052: 加葉田雄太朗 (長崎大), 内田誠一 (九大), “多目的最適化問題の一意解のための特異点論応用(第三報)”
  • IS-3-053: 相澤宏旭, 福田幸平, 栗田多喜夫 (広島大), “M推定された勾配に基づく確率的勾配降下法”
  • IS-3-054: Chi Zhang (The University of Tokyo)*; Toshihiko Yamasaki (The University of Tokyo), “TDiffCF: Trainable Diffusion Model for Collaborative Filtering”
  • IS-3-055: 尾﨑優也, 出口大輔 (名大), 久徳遙矢 (愛知工科大), 村瀬洋 (名大), “学習活動ログを用いたAt-risk学生の早期検出:学習活動予測ネットワークの活用”
  • IS-3-056: 岡村洋希, 前田圭介, 藤後廉, 小川貴弘, 長谷山美紀 (北大), “協調フィルタリングにおける潜在因子モデルの埋め込み表現のICAを用いた線形的構造の分析”
  • IS-3-057: 深田紘希, 島田伸敬 (立命館大), 本田敦, 吉浦竜一, 枡岡久子 (ニップン), “多様な環境間でのメタ知識共有に基づく粒状食材の定量把持制御”
  • IS-3-058: Mashiro Toyooka (The University of Tokyo)*; Atsuyuki Miyai (The University of Tokyo); Qing Yu (The University of Tokyo); Go Irie (Tokyo University of Science); Kiyoharu Aizawa (The University of Tokyo), “ブラックボックス視覚言語モデルのためのFew-Shot教師なしプロンプト学習 (Few-Shot Unsupervised Prompt Learning for Black-Box Vision-Language Models)”
  • IS-3-059: koyo Imai (Chubu University)*; Naoto Hayashi (Chubu University); Tsubasa Hirakawa (Chubu University); Takayoshi Yamashita (Chubu University); Hironobu Fujiyoshi (Chubu Univ.), “Contrastive Lossを導入したEMP-SSLによる自己教師ありオンライン継続学習 (Self-Supervised Online Continual Learning by EMP-SSL with Contrastive Loss)”
  • IS-3-060: Yuya Otsuka (LY Corporation)*; Ryota Yoshihashi (LY Corporation); Kenji Doi (LY Corporation); Tomohiro Tanaka (LY Corporation), “拡散モデルを用いた意味領域分割のための擬似マスク生成における教師なしドメイン適応 (Unsupervised Domain Adaptation for Pseudo-Mask Generation in Semantic Segmentation Using Diffusion Models)”
  • IS-3-061: 佐合建人, 堀田一弘 (名城大), “スコア重みと関連性スコアの重みづけ統合よるVision Transformerの判断根拠の可視化”
  • IS-3-062: 入澤優太 (青学大), 伊東聖矢 (NICT), 栗田修平 (理研), 赤坂亮太 (阪大), 大西正輝 (産総研), 大原剛三 (青学大), 櫻田健 (産総研), “LPT Dataset: 画像プライバシー認識を目的とした大規模言語モデルによるプライバシーテキストデータセットの構築”
  • IS-3-063: 平本麗弥, 前田英作 (電機大), “DNNモデルの学習過程におけるModel Extraction Attackに対する頑健性について”
  • IS-3-064: 木全潤, 玉木徹 (名工大), “動作認識における複数データセット学習のための固有LoRAと共有LoRA”
  • IS-3-065: Yanan Wang (KDDI Research)*; Shuichiro Haruta (KDDI Research, Inc.); Donghua Zeng (KDDI Research); Mori Kurokawa (KDDI Research, Inc.), “Multi-object event graph representation learning for Video Question Answering”
  • IS-3-066: Zhenzhen Quan (Shandong University)*; Jialei Chen (Nagoya University); Chenkai ZHANG (Nagoya University); Daisuke Deguchi (Nagoya University); Hiroshi Murase (Nagoya University), “A Decoupled Knowledge Distillation Approach for RGB-to-Infrared Video Action Recognition”
  • IS-3-067: 鈴木真, 鷲見和彦 (青学大), “追加ラベルとブランチ分割による行動予測の検討”
  • IS-3-068: 利重夏美, 陳訓泉, 岡部正幸 (県立広島大), 陳金輝 (和歌山大), “SlowFastモデルを用いた転倒行動の認識”
  • IS-3-069: Yasufumi Kawano (Keio Univ.)*; Yoshimitsu Aoki (Keio University), “MaskDiffusion: Exploiting Pre-trained Diffusion Models for Semantic Segmentation”
  • IS-3-070: 黒肥地立樹, 吉村優大, 八谷大岳 (和歌山大), “周波数空間MLP-Mixerを用いた鏡面物体検出”
  • IS-3-071: 吉村優大, 八谷大岳 (和歌山大), “RGBと偏光情報の深層マルチモーダル統合による鏡面検出”
  • IS-3-072: 内田輝 (東工大), 吉田悠一 (デンソーアイティーラボラトリ/東工大), 池畑諭 (東工大), 佐藤育郎 (デンソーアイティーラボラトリ/東工大), “不良品検出のためのデワーピング拡散モデル”

13:30 - 15:00 Interactive session 3B (IS-3B): 1F Exhibition Hall

  • IT-11: Yusuke Takimoto, Hikari Takehara, Hiroyuki Sato (Huawei Technologies Japan K.K.), Zihao Zhu (Keio Univ., Huawei Technologies Japan K.K.), Bo Zheng (Huawei Technologies Japan K.K.), “Dr.Hair: Reconstructing Scalp-Connected Hair Strands without Pre-training via Differentiable Rendering of Line Segments”, [CVPR]
  • IT-12: Zhixiang Wang (Univ. of Tokyo, NII), Baiang Li (Hefei Univ. of Technology), Jian Wang (Snapchat), Yu-Lun Liu (National Yang Ming Chiao Tung Univ.), Jinwei Gu (Univ. of Hong Kong), Yung-Yu Chuang (National Taiwan Univ.), Shin’ichi Satoh (NII, Univ. of Tokyo), “Matting by Generation”, [SIGGRAPH]
  • IT-13: Yusuke Sekikawa, Shingo Yashima (DENSO IT Laboratory), “SAS: Structured Activation Sparsification”, [ICLR]
  • IT-14: Soichiro Kumano (Univ. of Tokyo), Hiroshi Kera (Chiba Univ.), Toshihiko Yamasaki (Univ. of Tokyo), “Theoretical Understanding of Learning from Adversarial Perturbations”, [ICLR]
  • IT-15: Atsuyuki Miyai (Univ. of Tokyo), Qing Yu (LY, Univ. of Tokyo), Go Irie (Tokyo Univ. of Science), Kiyoharu Aizawa (Univ. of Tokyo), “LoCoOp: Few-Shot Out-of-Distribution Detection via Prompt Learning”, [NeurIPS]
  • IT-16: Yuki Fujimura (NAIST), Masaaki Iiyama (Shiga Univ.), Takuya Funatomi, Yasuhiro Mukaigawa (NAIST), “Deep Depth from Focal Stack with Defocus Model for Camera-Setting Invariance”, [IJCV]
  • IS-3-073: Takuya Tsujimura (osaka metropolitan university)*; Katsufumi Inoue (Osaka Metropolitan University); Michifumi Yoshioka (Osaka Metropolitan University); Toshihiro Yamada (Hokkaido University), “スタイル変換とフラクタル画像を用いた植物化石検出手法の検討 (Examination of Method for Detecting Plant Fossils Using Style Transfer and Fractal Images)”
  • IS-3-074: Yuki Nishimura (TOSHIBA CORPORATION)*; Ryota Sekiya (TOSHIBA CORPORATION); Hiroki Mori (TOSHIBA CORPORATION), “合成開口レーダ画像向けニューラルネットワークにおける​少量訓練データ対策の有効性検証 (Verification of the Effectiveness of Measures to Train Neural Network for Synthetic Aperture Radar Images by Limited Data)”
  • IS-3-075: 清水一樹, 遠里由佳子 (立命館大), “潜在拡散モデルと自己注意ガイダンスによる線⾍の動画像の異常検知”
  • IS-3-076: Ryoya Nara (The University of Tokyo)*; Yu-Chieh Lin (Kioxia Corporation); Yuji Nozawa (Kioxia Corporation); Youyang Ng (Kioxia Corporation); Goh Itoh (Kioxia Corporation); Osamu Torii (Kioxia Corporation); Yusuke Matsui (The University of Tokyo), “CLIPと適合性フィードバックによる対話的検索システム (Revisiting Relevance Feedback for CLIP-based Interactive Image Retrieval)”
  • IS-3-077: 昇洋太, 小篠裕子 (電機大), 田中正行 (東工大), “ハイパースペクトル画像に基づくペンギンの個体識別”
  • IS-3-078: Lauri Klemettinen (Toyohashi University of Technology); Yuki Sato (Toyohashi University of Technology); Yasushi Kanazawa (Toyohashi University of Technology)*; Jun Sonoda (National Institute of Technology, Sendai College), “Interpolation of Ground Penetrating Radar Images using Deep Latent Variable Models”
  • IS-3-079: Shota Nakada (LY Corporation)*; Taichi Nishimura (LY Corporation); Hokuto Munakata (LY Corporation); Tatsuya Komatsu (LY Corporation); Masayoshi Kondo (LY Corp.), “音を発生させる物体を考慮した視聴覚表現学習 (Fine-grained Audio-Visual Representation Learning from Sounding Objects)”
  • IS-3-080: 畠中飛羽, 檜作彰良, 小林慎平, 中山良平 (立命館大), “Multiple Instance LearningとSelf-attention Mechanismを用いた監視カメラ映像における異常行動検知”
  • IS-3-081: 竹下隼, 廣瀬七海, 朝枝彩夏, 武村紀子 (九工大), “顔画像とオプティカルフロー画像を用いた学習時のエンゲージメント推定”
  • IS-3-082: 廣部理来, 繁田浩功, 瀬尾茂人, 内田穣, 石井優, 松田秀雄 (阪大), “蛍光顕微鏡画像における3D U-Netを用いた3次元細胞追跡手法”
  • IS-3-083: 太田朔哉, 金崎朝子 (東工大), “テキスト付き動画データを用いた動作生成に関する研究”
  • IS-3-084: Jing YANG (UEC); Junwen Chen (The University of Electro-Communications); JINGBIN XU (The University of Electro-Communications); Keiji Yanai (The University of Electro-Communications, Tokyo)*, “RecipeSD: Injecting Recipe Embedding into Food Image Synthesis using Stable Diffusion”
  • IS-3-085: 松雄なずな, 出口大輔, 村瀬洋 (名大), “拡散モデルを用いた人物の後ろ姿からの正面服装画像生成”
  • IS-3-086: Ryota Kaji (The University of Electro-Communications)*; Keiji Yanai (The University of Electro-Communications, Tokyo), “動画拡散モデルを用いた複数物体におけるゼロショット動作制御 (Zero-Shot Motion Control in Multiple Objects Using Video Diffusion Model)”
  • IS-3-087: Masakazu Yoshimura (Sony Group Corporation)*; Junji Otsuka (Sony Group Corporation); Takeshi Ohashi (Sony Group Corporation), “PQDynamicISP: Dynamically Controlled Image Signal Processor for Any Image Sensors Pursuing Perceptual Quality”
  • IS-3-088: Yuki Kondo (Toyota Motor Corporation)*; Takayuki Kanai (Toyota Motor Corporation); Kota Shinjo (Toyota Motor Corporation); Ken Sakurada (Kyoto University), “Beyond Image Stitching: 幾何的整合性を担保するFoV拡大タスク FoVE (Novel NVS task FoVE imposing geometric and luminance fidelity)”
  • IS-3-089: YI LIU (Graduate School of Information Science and Technology, OSAKA University )*; Sudhakar Kumawat (Osaka University); Hajime Nagahara (Osaka University), “ハードウェアでモダリティ融合を用いた画像セグメンテーション (Deep Hardware Modality Fusion for Image Segmentation)”
  • IS-3-090: 工藤紗織, 鎌田清一郎 (早大), “ハイパースペクトル画像超解像のためのスペクトル・グルーピングTransformer”
  • IS-3-091: Masato Ishii (Sony AI)*; Akio Hayakawa (Sony AI); Takashi Shibuya (Sony AI); Yuki Mitsufuji (Sony AI), “A Simple but Strong Baseline for Sounding Video Generation”
  • IS-3-092: 中嶋淳一, 深津真二 (NTT), “リアルタイム4倍動画超解像の効率的モデルに関する検証”
  • IS-3-093: 竹長慎太朗, 辻栄翔 (筑波大, 産総研), 大西正輝 (産総研), “物体検出におけるドメインシフトを軽減するための複数の画像情報を混ぜ合わすデータ拡張”
  • IS-3-094: Daijiro Higashi (Meijo University)*; Kotaro Kurake (Meijo University); Tsuyoshi Tasaki (Meijo University), “単眼カメラによる三次元地図を利用した動的障害物のスケール付き距離推定 (Monocular metric scale obstacle detection by using 3D-Map)”
  • IS-3-095: 渡邉拓海, 川上玲, 田中正行, 奥富正敏 (東工大), “複数のトーンマッピングを利用したHDR画像のための物体検出手法”
  • IS-3-096: Taito Kato (National Institute of Technology, Sendai College); Jun Sonoda (National Institute of Technology, Sendai College)*, “UAV空撮画像とYOLOv8による背景分類を適用した海岸漂着物の自動検出 (Automatic Detection of Beach Debris by Applying UAV Aerial Imagery and YOLOv8 Background Classification)”
  • IS-3-097: 齊藤廣大 (東芝), “Few-shot物体カウントの過検出低減の検討”
  • IS-3-098: 濵口恵, 右田雅裕, 相田光宏, 檜垣匠, 戸田真志 (熊本大), “植物の表現型解析のためのインスタンスセグメンテーションを用いた葉領域の検出とその利用”
  • IS-3-099: 吉田温登, 滝之弥, 加藤邦人, 寺田和憲 (岐阜大), 篠井暖, 塩澤安生 (ヤマハ), “大規模視覚言語モデルによる木目官能検査の自動化と判断根拠生成”
  • IS-3-100: Takuya Nanri (Nissan Motor Co., Ltd.)*; Siyuan Wang (Nissan Motor Co., Ltd.); Akio Shigekane (Nissan Motor Co., Ltd.); jo nishiyama (NISSAN MOTOR CO.,LTD.); Tao Chu (Nissan Motor Co., Ltd.); Kohei Yokosawa (Nissan Motor Co., Ltd.), “大規模マルチモーダルモデルを用いた自動運転のための将来軌道説明の検討 (Trim-Former: Trajectory Explanation using Multi-modal Large Language Model for Autonomous Driving)”
  • IS-3-101: 仁科久那斗, 松井勇佑 (東大), “SVGEditBench: LLMのSVG編集性能評価のためのベンチマークデータセット”
  • IS-3-102: 石井尚悟, 山崎禎晃, 村田健悟 (青学大), 伊東聖矢 (NICT, 青学大), 大原剛三 (青学大), “Text-to-Image生成の物体網羅性の向上を目的とした早期リトライ型再生成フレームワーク”
  • IS-3-103: 斎藤奎介, 久保友輔, 山家暢, 髙木義徳, 木村知玄 (スクリーン), “CNN中間層をBackboneに用いたLVLMによる検査画像説明”
  • IS-3-104: Teppei Suzuki (SB Intuitions)*; Seitaro Shinagawa (Nara Institute of Science and Technology), “Instructable Image Encoding”
  • IS-3-105: 宮脇智也, 中嶋一斗, 劉瀟文 (九大), 岩下友美 (JPL), 倉爪亮 (九大), “拡散モデルの条件付き生成を用いたLiDARデータのSim2Realドメイン変換”
  • IS-3-106: Zhang Run Shi (Osaka University)*; Xiang Li (Osaka University); Chi Xu (Osaka University); Prof. Yasushi Yagi (Osaka University), “Multi-View Large Population Gait Database with Point Clouds and Its Performance Evaluation for LiDAR-based Gait Recognition”
  • IS-3-107: 新村文郷, 巻島英二朗, 村松大吾 (成蹊大), “自転車乗車人物のシルエット系列データベースの構築”
  • IS-3-108: 吉野弘毅, 中嶋一斗, アン・ジョンホ (九大), 岩下友美 (JPL), 倉爪亮 (九大), “RGB情報を活用したデータ拡張に基づく歩容認証”
  • IS-3-109: Julian Jorge Andrade Guerreiro (The University of Tokyo)*; Naoto Inoue (CyberAgent); Kento Masui (CyberAgent); Mayu Otani (CyberAgent); Hideki Nakayama (The University of Tokyo), “Exploring Flow Matching for Layout Generation”
  • IS-3-110: Keigo Kunikata (Tokyo University of Science)*; Amane Kashino (Tokyo University of Science); Yota Yamamoto (Tokyo University of Science); Yukinobu Taniguchi (Tokyo University of Science); Yoko Sogabe ( NTT Corporation); Ayumi Matsumoto (NTT Corporation); Masaki Kitahara (NTT Corporation); Go Irie (Tokyo University of Science), “Person Identification from Hyperspectral Hand Images”
  • IS-3-111: Tatsuki Arai (Keio University)*; Mariko Isogawa (Keio University); Kuniharu Sakurada (Keio University); Maki Sugimoto (Keio University), “超低解像度熱画像を用いた三次元人物姿勢推定 (3D Human Pose Estimation Using Thermal Images Considering Ambient Temperature)”
  • IS-3-112: Yuki Era (Hokkaido University)*; Ren Togo (Hokkaido University); Keisuke Maeda (Hokkaido University); Takahiro Ogawa (Hokkaido University); Miki Haseyama (Hokkaido University), “Metadata-independent Learning and Unified Dataset for Generalized Motion Generation Method”
  • IS-3-113: 和田智輝, 伊藤康一, 青木孝文 (東北大), “撮影環境の変動に頑健な動画像からの手の3次元姿勢推定手法の検討”
  • IS-3-114: 鳥見晃平, 青木義満 (慶大), “ゴルフスイング解析における追加関節点を考慮した2次元姿勢推定”
  • IS-3-115: Matthew Teng Kit Khinn (Kyushu Institute of Technology)*; Haibo Zhang (Kyushu Institute of Technology); Takeshi Saitoh (Kyushu Institute of Technology), “Exploring Motion History Images with LGNMNet-RF for Micro-Expression Spotting”
  • IS-3-116: 佐藤光希, 荒金大清, 張海波, 齊藤剛史 (九工大), “生成モデルによる発話シーンを利用した日本語文章読唇”
  • IS-3-117: Akos Godo (Osaka University)*, “PPGCN: Phase-aligned Periodic Graph Convolutional Network for Dual-task-based Cognitive Impairment Detection”
  • IS-3-118: 正井克俊 (九大), “クロスモダリティ環境での事前学習方法の検討”
  • IS-3-119: 三好遼, 岡藤勇希 (サイバーエージェント), “不確かな欠損モダリティを含む自己蒸留を用いたロバストなマルチモーダル感情認識”
  • IS-3-120: 秋定大介, 山添大丈 (兵庫県立大), “集中・非集中状態推定に向けた顔表情と視線の動きの分析と機械学習による集中度推定モデルの検討”
  • IS-3-121: Chiyun Li (The University of Tokyo)*; Yilin Wen (The University of Tokyo); Yusuke Sugano (The University of Tokyo), “A Preliminary Study on Face Anonymization in Gaze Estimation”
  • IS-3-122: 城間亮, 中西慶一, 片渕凌也, 徳永旭将 (九工大), “外部視覚注視機構による異常検出性能の高い注視領域生成方法の解析”
  • IS-3-123: 笹口翔吾, 中直斗, Bisser Raytchev, 檜垣徹, 金田和文 (広島大), 上村匠, 川口幹祐, 佐藤圭峰, 植木義治, 小林謙太, 和田好隆 (マツダ), “Transformerを用いた内燃機関の熱発生率解析のサロゲートモデル化に関する研究”
  • IS-3-124: Ryoga Takahashi (Tokyo University of Science)*; Yota Yamamoto (Tokyo University of Science); Ryosuke Furuta (The University of Tokyo); Yukinobu Taniguchi (Tokyo University of Science), “高速カメラの動画解析を用いたドア閉じ異常検知 (Detection of Door Closing Defects by Analyzing Video from a High-speed Camera)”
  • IS-3-125: 森川元晴, 前田英作 (東京電機大), “工業製品の異常検知における事前学習効果の検討”
  • IS-3-126: Naoki Yoshida (DAIKIN INDUSTRIES, LTD.)*; Taiho Takeuchi (Fairy Devices Inc.); Takuya Ohara (DAIKIN INDUSTRIES, LTD.); Tomohiro Mito (Fairy Devices Inc.); Yoshinao Sato (Fairy Devices Inc.); Yoshifumi Seki (Fairy Devices Inc.); Shohei Hido (DAIKIN INDUSTRIES, LTD.), “一人称視点映像の作業認識と自己教師あり学習の試み (Task Recognition and Self-Supervised Learning from First-Person View Videos)”
  • IS-3-127: 西川由馬, 坂本大地, 坂上文彦, 佐藤淳 (名工大), “繊維製品の画像検査のための異常判別器と照明条件の同時最適化”
  • IS-3-128: Daichi Tanaka (Tokyo Institute of Technology)*; Takumi Karasawa (Tokyo Institute of Technology); Rei Kawakami (Tokyo Institute of Technology), “鉄スクラップのリサイクルのための生成モデルを活用したテキストと画像の少数例示による異常の領域分割 (Few-shot Anomaly Detection Utilizing A Generative Model for Scrap Metal Recycling)”
  • IS-3-129: 吉永貴津那, 安川真輔 (九工大), “イチゴ果柄の位置と方向の推定技術”
  • IS-3-130: 伊藤聖, 本谷秀堅, 横田達也 (名工大), “非剛体位置合わせをガイドとする拡散モデルによる異なるモダリティ画像の事後確率分布サンプリング”
  • IS-3-131: 福冨舜介 (名工大), Basile Maillé (EFREI), 本谷秀堅, 横田達也 (名工大), “事後確率からのサンプリングによる加速MRI画像の高精度復元”
  • IS-3-132: 田中航一, 古川栞, 武村紀子 (九工大), “マルチタスク学習を用いた歩容映像によるロコモティブシンドローム推定”
  • IS-3-133: 小田直哉, 西川広記, 谷口一徹, 尾上孝雄 (阪大), “疑似ラベリングを用いた尿中有形成分分類の高精度化”
  • IS-3-134: 西村和也, 小嶋泰弘 (国立がん研究センター), “Masked Autoencoderを用いた病理画像からの空間遺伝子発現予測”
  • IS-3-135: Azuma Miura (Keio University)*; Hideo Saito (Keio University), “自動マスクプロンプト作成とEfficientViTによるSAMの改良 (Automatic High-Quality Mask Prompt Generation for SAM Enhancement in Endoscopic Videos Using EfficientViT)”
  • IS-3-136: Roma Satoh (Tokyo Institute of Technology)*; Nakamasa Inoue (Tokyo Institute of Technology); Rei Kawakami (Tokyo Institute of Technology), “ロボットによる物体再配置の予測における隆起関数を用いた衝突回避 (Collision Avoidance in Object Relocation by Robots Using Bump Functions)”
  • IS-3-137: Daichi Azuma (Sony Semiconductor Solutions)*; Taiki Miyanishi (The University of Tokyo); Shuhei Kurita (RIKEN AIP); Koya Sakamoto (Kyoto University); Motoaki Kawanabe (Advanced Telecommunications Research Institute International (ATR)), “実世界質問応答のための拡散モデルを用いた回答可能位置の予測 (Answerability Fields: Answerable Location Estimation via Diffusion Models)”
  • IS-3-138: Jeonghun Baek (The University of Tokyo)*; Yusuke Matsui (The University of Tokyo); Kiyoharu Aizawa (The University of Tokyo), “Character Combination for Low-Resource Text Recognition (Character Combination for Scene Text Recognition with Low-Resource Data)”
  • IS-3-139: Jialei Chen (Nagoya University)*; Daisuke Deguchi (Nagoya University); Chenkai ZHANG (Nagoya University); Zhenzhen Quan (Shandong University); Hiroshi Murase (Nagoya University), “Distill from CLIP by Token Alignment for Inductive Zero-shot Semantic Segmentation”
  • IS-3-140: 西村俊彦, 嶋田知泰, 久保宏一郎, 村崎和彦, 吉田大我, 谷田隆一 (NTT), “階層的な粒度を考慮した点群データからの希少クラス認識に関する検討”
  • IS-3-141: Lucie Kunitomo-Jacquin ( National Institute of Advanced Industrial Science and Technology)*; Ken Fukuda (National Institute of Advanced Industrial Science and Technology), “Dempster-Shafer理論に基づく述語分類の提案 (Predicate classification based on Dempster-Shafer theory)”
  • IS-3-142: 中田道寛, 中野鐵兵, 小川哲司 (早大), “状態変化の頻度情報の抽出と家畜の映像監視のための特徴表現としての利用”
  • IS-3-143: 篠原陸玖 (奈良先端大), 橋本敦史, 小津野将, 吉田成朗 (オムロンサイニックエックス), 平尾悠太朗, ペルスキアエルナンデスモニカ, 内山英昭, 清川清 (奈良先端大), “ユーザ適応型アバタ姿勢操作法”
  • IS-3-144: Yusuke Sugizaki (The University of Tokyo)*; Jin Nakazato (The University of Tokyo); Manabu Tsukada (The University of Tokyo), “WebベースデジタルツインによるXR脱出ゲームの開発と評価 (Development and Evaluation of XR Escape Game with Web-based Digital Twin)”
  • IS-3-145: 辻真彦, 横張和也, 谷田隆一 (NTT), “リアル/バーチャル空間を重畳させる非対称CVEにおける空間の重畳ずれが与える影響の一考察”

15:10 - 16:00 Special session: 4F Main Hall

16:00 - 16:30 Closing and award ceremony: 4F Main Hall


Copyright (c) 2024, MIRU2024; all rights reserved.