データサイエンス学部 データサイエンス学科
平3京大・工・航空卒,平5同大大学院工学研究科修士課程了,平25東工大大学院情報理工学研究科博士課程了,博士(工学).平5 NEC入社,平18同社主任研究員,平25同社主幹研究員.平29人工知能学会理事,令1京大大学院情報学研究科非常勤講師.令2より横浜市立大学データサイエンス学部教授.パターン認識,信号処理,機械学習の研究に興味をもつ.
2025/05/09 更新
平3京大・工・航空卒,平5同大大学院工学研究科修士課程了,平25東工大大学院情報理工学研究科博士課程了,博士(工学).平5 NEC入社,平18同社主任研究員,平25同社主幹研究員.平29人工知能学会理事,令1京大大学院情報学研究科非常勤講師.令2より横浜市立大学データサイエンス学部教授.パターン認識,信号処理,機械学習の研究に興味をもつ.
博士(工学) ( 2013年3月 東京工業大学 )
自然言語処理
音声認識
深層学習
信号処理
人工知能
パターン認識
機械学習
情報通信 / 知能ロボティクス
情報通信 / 知覚情報処理
情報通信 / 知能情報学
東京工業大学 大学院情報理工学研究科 計算工学専攻
2009年10月 - 2013年3月
国名: 日本国
京都大学 大学院工学研究科 航空工学専攻
1991年4月 - 1993年3月
国名: 日本国
京都大学 工学部 航空工学科
1987年4月 - 1991年3月
国名: 日本国
横浜市立大学 データサイエンス学部 教授
2020年9月 - 現在
国名:日本国
日本電気株式会社 バイオメトリクス研究所 主幹研究員
2018年3月 - 2020年8月
国名:日本国
日本電気株式会社 データサイエンス研究所 主幹研究員
2016年4月 - 2018年3月
国名:日本国
日本電気株式会社 情報・メディアプロセッシング研究所 主幹研究員
2015年4月 - 2018年3月
国名:日本国
日本電気株式会社 情報・メディアプロセッシング研究所 主任研究員
2010年4月 - 2013年3月
国名:日本国
日本電気株式会社 共通基盤ソフトウェア研究所 主任研究員
2007年4月 - 2010年3月
国名:日本国
日本電気株式会社 メディア情報研究所 主任研究員
2006年4月 - 2007年3月
国名:日本国
言語処理学会
2021年2月 - 現在
人工知能学会
2017年10月 - 現在
IEEE
2013年3月 - 現在
日本音響学会
2004年12月 - 現在
電子情報通信学会
1993年6月 - 現在
ISO/IEC JTC1/SC29 WG1 国内小委員会 委員
2021年5月 - 現在
団体区分:学協会
IEEE BigData2022 Organizing Committee Local Arrangement Co-chair
2020年12月 - 2022年12月
団体区分:学協会
The Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA 2021) Sponsorship Co-chair
2019年12月 - 2021年12月
団体区分:学協会
人工知能学会 代議員
2019年6月 - 現在
団体区分:学協会
The Speaker and Language Recognition Workshop (Odyssey 2020) General Co-chair
2018年6月 - 2020年11月
団体区分:学協会
人工知能学会 理事
2017年6月 - 2019年6月
団体区分:学協会
Industrial Membership Committee, Asia-Pacific Signal and Information Processing Association (APSIPA) Committee Member
2016年6月 - 2018年6月
団体区分:学協会
電子情報通信学会音声研究専門委員会 研究専門委員
2013年5月 - 2017年4月
団体区分:学協会
法科学分野への応用を想定したテキスト独立話者照合の精度評価
小澤茂樹, 後藤晃, 斉藤裕子, 松浦廣樹, 越仲孝文
信学技報 124 ( 391 ) 34 - 39 2025年3月
検索エンジンを指向したLLMのアラインメント
益子怜, 木村賢, 越仲孝文
言語処理学会第31回年次大会 2025年3月
Reading is Believing: Revisiting Language Bottleneck Models for Image Classification 査読
Honori Udo, Takafumi Koshinaka
2024 IEEE International Conference on Image Processing (ICIP) 943 - 949 2024年10月
テキストプロンプトによるデザイン変更が可能な試着画像生成
武本 孝輔, 越仲 孝文
2024年度人工知能学会全国大会(JSAI2024) 2024年5月
LLM生成コンテンツのSEO観点での品質評価
益子怜, 木村賢, 越仲孝文
言語処理学会年次大会発表論文集(Web) 30th 2024年
Generalized Domain Adaptation Framework for Parametric Back-End in Speaker Recognition 査読
Qiongqiong Wang, Koji Okabe, Kong Aik Lee, Takafumi Koshinaka
IEEE Transactions on Information Forensics and Security 18 3936 - 3947 2023年6月
画像キャプショニングは画像そのものよりも多くを語る
有働帆乃璃, 越仲孝文
人工知能学会全国大会論文集(Web) 37th 2023年6月
感情付与を用いた低評価レビューに対する応答生成
益子怜, 越仲孝文
人工知能学会全国大会論文集(Web) 37th 2023年6月
ECサイトのレビューテキストからのレーティング予測と購買者評価の分析
小林義幸, 越仲孝文
人工知能学会全国大会論文集(Web) 36th 2022年6月
Task-aware Warping Factors in Mask-based Speech Enhancement 査読
Qiongqiong Wang, Kong Aik Lee, Takafumi Koshinaka, Koji Okabe, Hitoshi Yamamoto
European Signal Processing Conference (EUSIPCO 2021) 2021年8月
Xi-Vector Embedding for Speaker Recognition 査読
Kong Aik Lee, Qiongqiong Wang, Takafumi Koshinaka
IEEE Signal Processing Letters 28 1385 - 1389 2021年7月
A Generalized Framework for Domain Adaptation of PLDA in Speaker Recognition 査読
Qiongqiong Wang, Koji Okabe, Kong Aik Lee, Takafumi Koshinaka
ICASSP 2020 - 2020 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) 2020年5月
Using Multi-Resolution Feature Maps with Convolutional Neural Networks for Anti-Spoofing in ASV 査読
Qiongqiong Wang, Kong Aik Lee, Takafumi Koshinaka
Odyssey 2020 The Speaker and Language Recognition Workshop 2020年5月
NEC-TT System for Mixed-Bandwidth and Multi-Domain Speaker Recognition. 査読
Kong Aik Lee, Hitoshi Yamamoto, Koji Okabe, Qiongqiong Wang, Ling Guo, Takafumi Koshinaka, Jiacen Zhang, Koichi Shinoda
Computer Speech and Language 61 101033 - 101033 2020年5月
Study on comparison of individuality of ear canal shape
Riki Kimura, Shohei Yano, Rui Fujitsuka, Naoki Wakui, Takayuki Arakawa, Takafumi Koshinaka
148th Audio Engineering Society International Convention 2020年
NEC-TT speaker verification system for SRE'19 CTS challenge
Kong Aik Lee, Koji Okabe, Hitoshi Yamamoto, Qiongqiong Wang, Ling Guo, Takafumi Koshinaka, Jiacen Zhang, Keisuke Ishikawa, Koichi Shinoda
Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH 2020- 2227 - 2231 2020年
Speaker Augmentation and Bandwidth Extension for Deep Speaker Embedding 査読
Hitoshi Yamamoto, Kong Aik Lee, Koji Okabe, Takafumi Koshinaka
Interspeech 2019 2019年9月
The NEC-TT 2018 Speaker Verification System 査読
Kong Aik Lee, Hitoshi Yamamoto, Koji Okabe, Qiongqiong Wang, Ling Guo, Takafumi Koshinaka, Jiacen Zhang, Koichi Shinoda
Interspeech 2019 2019年9月
Unleashing the Unused Potential of i-Vectors Enabled by GPU Acceleration 査読
Ville Vestman, Kong Aik Lee, Tomi H. Kinnunen, Takafumi Koshinaka
Interspeech 2019 2019年9月
The CORAL+ Algorithm for Unsupervised Domain Adaptation of PLDA 査読
Kong Aik Lee, Qiongqiong Wang, Takafumi Koshinaka
ICASSP 2019 - 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) 2019年5月
Feature selection and its evaluation in binaural ear acoustic authentication
Masaki Yasuhara, Shohei Yano, Takayuki Arakawa, Takafumi Koshinaka
AES 146th International Convention 2019年
Attention Mechanism in Speaker Recognition: What Does it Learn in Deep Speaker Embedding? 査読
Qiongqiong Wang, Koji Okabe, Kong Aik Lee, Hitoshi Yamamoto, Takafumi Koshinaka
2018 IEEE Spoken Language Technology Workshop (SLT) 2018年12月
Shivangi Mahto, Takayuki Arakawa, Takafumi Koshinaka
2018 26th European Signal Processing Conference (EUSIPCO) 2018年9月
Attentive Statistics Pooling for Deep Speaker Embedding 査読
Koji Okabe, Takafumi Koshinaka, Koichi Shinoda
Interspeech 2018 2018年9月
DNN Based Speaker Embedding Using Content Information for Text-Dependent Speaker Verification 査読
Subhadeep Dey, Takafumi Koshinaka, Petr Motlicek, Srikanth Madikeri
2018 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) 2018年4月
Robust i-vector extraction tightly coupled with voice activity detection using deep neural networks 査読
Hitoshi Yamamoto, Koji Okabe, Takafumi Koshinaka
2017 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC) 2017年12月
Unsupervised Discriminative Training of PLDA for Domain Adaptation in Speaker Verification 査読
Qiongqiong Wang, Takafumi Koshinaka
Interspeech 2017 2017年8月
i-Vector Transformation Using a Novel Discriminative Denoising Autoencoder for Noise-Robust Speaker Recognition 査読
Shivangi Mahto, Hitoshi Yamamoto, Takafumi Koshinaka
Interspeech 2017 2017年8月
誤差の周波数拡散と加算平均処理による耳音紋認証の精度向上 査読
矢野 昌平, 荒川 隆行, 越仲 孝文, 今岡 仁, 入澤 英毅
信学論A J100-A ( 4 ) 161 - 168 2017年4月
Fast and accurate personal authentication using ear acoustics 査読
Takayuki Arakawa, Takafumi Koshinaka, Shohei Yano, Hideki Irisawa, Ryoji Miyahara, Hitoshi Imaoka
2016 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA) 2016年12月
Domain adaptation using maximum likelihood linear transformation for PLDA-based speaker verification 査読
Qiongqiong Wang, Hitoshi Yamamoto, Takafumi Koshinaka
2016 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) 2016年3月
Denoising autoencoder-based speaker feature restoration for utterances of short duration 査読
Hitoshi Yamamoto, Takafumi Koshinaka
Interspeech 2015 2015年9月
Speech/acoustic analysis technology - Its application in support of public solutions
Takafumi Koshinaka, Osamu Hoshuyama, Yoshifumi Onishi, Ryosuke Isotani, Masahiro Tani
NEC Technical Journal 9 ( 1 ) 82 - 85 2015年1月
Anomaly detection of motors with feature emphasis using only normal sounds 査読
Yumi Ono, Yoshifumi Onishi, Takafumi Koshinaka, Soichiro Takata, Osamu Hoshuyama
2013 IEEE International Conference on Acoustics, Speech and Signal Processing 2013年5月
音声ドキュメント検索のためのインデクシング技術の研究 査読
越仲 孝文
東京工業大学 ( 甲第9187号 ) 2013年3月
Shuji Komeiji, Takayuki Arakawa, Takafumi Koshinaka
2012 IEEE Spoken Language Technology Workshop (SLT) 2012年12月
Online Speaker Clustering Using Incremental Learning of an Ergodic Hidden Markov Model 査読
KOSHINAKA Takafumi, NAGATOMO Kentaro, SHINODA Koichi
IEICE transactions on information and systems E95.D ( 10 ) 2469 - 2478 2012年10月
大西 祥史, 江森 正, 越仲 孝文, 篠田 浩一
信学論D J95-D ( 5 ) 1276 - 1285 2012年5月
Committee-Based Active Learning for Speech Recognition 査読
HAMANAKA Yuzo, SHINODA Koichi, TSUTAOKA Takuya, FURUI Sadaoki, EMORI Tadashi, KOSHINAKA Takafumi
IEICE transactions on information and systems E94-D ( 10 ) 2015 - 2023 2011年11月
Speech modeling based on committee-based active learning 査読
HAMANAKA Y.
Proc. ICASSP, Dallas, 2010 2010年3月
Online speaker clustering using incremental learning of an ergodic hidden Markov model 査読
Takafumi Koshinaka, Kentaro Nagatomo, Koichi Shinoda
2009 IEEE International Conference on Acoustics, Speech and Signal Processing 2009年4月
Open-vocabulary spoken-document retrieval based on query expansion using related web documents 査読
Makoto Terao, Takafumi Koshinaka, Shinichi Ando, Ryosuke Isotani, Akitoshi Okumura
Interspeech 2008 2008年9月
Takafumi Koshinaka, Akitoshi Okumura, Ryosuke Isotani
Electronics and Communications in Japan (Part II: Electronics) 90 ( 12 ) 1 - 11 2007年12月
HMMの変分ベイズ学習によるテキストセグメンテーション及びその映像インデキシングへの応用 査読
越仲 孝文, 奥村 明俊, 磯谷 亮輔
信学論D J89-D ( 9 ) 2113 - 2122 2006年9月
Takafumi Koshinaka, Ken-ichi Iso, Akitoshi Okumura
Proceedings. (ICASSP '05). IEEE International Conference on Acoustics, Speech, and Signal Processing, 2005. 2005年3月
A Stochastic Model for Handwritten Word Recognition Using Context Dependency Between Character Patterns 査読
Takafumi Koshinaka, Daisuke Nishiwaki, Keiji Yamada
The 6th International Conference on Document Analysis and Recognition (ICDAR 2001) 2001年9月
Pressure waves in a separated gas-liquid layer in a horizontal duct with a step 査読
Takafumi Koshinaka, Shigeki Morioka
Fluid Dynamics Research 12 ( 6 ) 323 - 333 1993年12月
Reading Is Believing: Revisiting Language Bottleneck Models for Image Classification
Honori Udo, Takafumi Koshinaka
2024年6月
Generalized domain adaptation framework for parametric back-end in speaker recognition
Qiongqiong Wang, Koji Okabe, Kong Aik Lee, Takafumi Koshinaka
2023年5月
Image Captioners Sometimes Tell More Than Images They See
Honori Udo, Takafumi Koshinaka
2023年5月
国際会議 Odyssey 2020 開催報告 招待
越仲 孝文, リー コンエイク, 篠田 浩一
電子情報通信学会 情報・システムソサイエティ誌 26 ( 2 ) 23 - 24 2021年8月
分散比の最悪ケースを考慮した線形判別分析とその耳音響認証への応用
伊藤良峻, 越仲孝文
日本音響学会研究発表会講演論文集(CD-ROM) 2020 2020年
I4U Submission to NIST SRE 2018: Leveraging from a Decade of Shared Experiences
Kong Aik Lee, Ville Hautamaki, Tomi Kinnunen, Hitoshi Yamamoto, Koji Okabe, Ville Vestman, Jing Huang, Guohong Ding, Hanwu Sun, Anthony Larcher, Rohan Kumar Das, Haizhou Li, Mickael Rouvier, Pierre-Michel Bousquet, Wei Rao, Qing Wang, Chunlei Zhang, Fahimeh Bahmaninezhad, Hector Delgado, Jose Patino, Qiongqiong Wang, Ling Guo, Takafumi Koshinaka, Jiacen Zhang, Koichi Shinoda, Trung Ngo Trong, Md Sahidullah, Fan Lu, Yun Tang, Ming Tu, Kah Kuan Teh, Huy Dat Tran, Kuruvachan K. George, Ivan Kukanov, Florent Desnous, Jichen Yang, Emre Yilmaz, Longting Xu, Jean-Francois Bonastre, Chenglin Xu, Zhi Hao Lim, Eng Siong Chng, Shivesh Ranjan, John H. L. Hansen, Massimiliano Todisco, Nicholas Evans
2019年4月
声認証技術がもたらす安全・安心で便利な社会 (バイオメトリクスを用いた社会価値創造特集) 招待
越仲 孝文, リー コンエイク
NEC技報 71 ( 2 ) 2019年3月
人間の耳には聴こえない音で個人を識別する耳音響認証技術 招待
荒川 隆行, 越仲 孝文
月刊自動認識 2019年3月
耳音響認証における観測ゆらぎ軽減手法の一検討
安原雅貴, 荒川隆行, 越仲孝文, 矢野昌平
人工知能学会全国大会論文集(Web) 33rd 2019年
話者クラスタリングを用いた話者照合手法のNIST SRE18における比較評価
GUO Ling, 山本仁, 岡部浩司, 越仲孝文
日本音響学会研究発表会講演論文集(CD-ROM) 2019 2019年
単一話者検出に最適化した話者クラスタリングを用いる話者照合
GUO Ling, 山本仁, 越仲孝文
日本音響学会研究発表会講演論文集(CD-ROM) 2019 2019年
複数の話者が混在する環境下のスコア統合に基づく話者照合
GUO Ling, 山本仁, LEE Kong Aik, 越仲孝文
日本音響学会研究発表会講演論文集(CD-ROM) 2018 2018年
花沢健, 越仲 孝文, 荒川 隆行
防衛技術ジャーナル 37 ( 439 ) 18 - 22 2017年10月
ヒアラブル技術によるヒューマン系IoTソリューションの取り組みと展望 (デジタルビジネスを支えるIoT特集) 招待
古谷 聡, 越仲 孝文, 大杉 孝司
NEC技報 70 ( 1 ) 47 - 51 2017年9月
外耳道音響特性を用いた高精度個人認証
荒川隆行, 矢野昌平, 越仲孝文, 入澤英毅, 今岡仁
日本音響学会研究発表会講演論文集(CD-ROM) 2016 2016年
i-vectorの重み付き次元圧縮と区分回帰による年齢推定
児島一郁, 山本仁, 越仲孝文
日本音響学会研究発表会講演論文集(CD-ROM) 2016 2016年
音声・音響分析技術とパブリックソリューションへの応用 (社会の安全・安心を支えるパブリックソリューション特集) 招待
越仲 孝文, 宝珠山 治, 大西 祥史, 磯谷 亮介, 谷 真宏
NEC技報 67 ( 1 ) 86 - 89 2014年11月
正常音スペクトルモデルに基づく機器異常検知方式における特徴量強調の効果
小野友督, 宝珠山治, 大西祥史, 越仲孝文
日本音響学会研究発表会講演論文集(CD-ROM) 2014 2014年
話者認識の国際動向 (小特集: 話者認識に関する研究の動向) 招待 査読
越仲 孝文, 篠田 浩一
日本音響学会誌 69 ( 7 ) 2013年7月
GMM-SVMによるテキスト非依存話者識別
谷真宏, 大西祥史, 越仲孝文
日本音響学会研究発表会講演論文集(CD-ROM) 2013 2013年
話者認識技術の現状と課題
網野加苗, 石原俊一, 小川哲司, 長内隆, 黒岩眞吾, 越仲孝文, 篠田浩一, 柘植覚, 西田昌史, 松井知子, WANG Longbiao
電子情報通信学会技術研究報告 112 ( 450(SP2012 115-131) ) 2013年
正常音の知識のみを利用した機器の異常検知
小野友督, 大西祥史, 越仲孝文, 高田宗一朗
日本音響学会研究発表会講演論文集(CD-ROM) 2012 2012年
音声・映像情報の構造化と検索 (小特集: 音声・映像認識連携への取り組み) 招待 査読
越仲 孝文, 大網 亮磨, 細見 格, 今岡 仁
情報処理 52 ( 1 ) 2011年10月
雑音抑圧法とモデル適応法の重み付き組み合わせに基づく耐雑音音声認識手法
古明地秀治, 荒川隆行, 越仲孝文
日本音響学会研究発表会講演論文集(CD-ROM) 2011 2011年
複数マイクロフォンを用いた音声区間検出
大西祥史, 越仲孝文, 篠田浩一
日本音響学会研究発表会講演論文集(CD-ROM) 2011 2011年
雑音抑圧法とモデル適応法を組み合わせた耐雑音音声認識手法 (言語理解とコミュニケーション)
古明地 秀治, 荒川 隆行, 越仲 孝文
電子情報通信学会技術研究報告 110 ( 356 ) 49 - 54 2010年12月
古明地秀治, 荒川隆行, 越仲孝文
電子情報通信学会技術研究報告 110 ( 357(SP2010 88-102) ) 49 - 54 2010年12月
古明地 秀治, 荒川 隆行, 越仲 孝文
研究報告音声言語情報処理(SLP) 2010 ( 9 ) 1 - 6 2010年12月
裁判員裁判向け音声認識システム (音声認識ソリューション・製品特集) 招待
越仲 孝文, 江森 正, 大西 祥史
NEC技報 63 ( 1 ) 41 - 90 2010年2月
オンライン話者クラスタリング技術と議事録作成支援への応用 (音声認識ソリューション・製品特集) 招待
越仲 孝文, 長友 健太郎
NEC技報 63 ( 1 ) 84 - 87 2010年2月
法廷における音声認識システムの開発-音響モデル及び言語モデル-
谷真宏, 北出祐, 江森正, 大西祥史, 越仲孝文, 佐藤研治
日本音響学会研究発表会講演論文集(CD-ROM) 2010 2010年
法廷における音声認識システムの開発-システム概要-
越仲孝文, 江森正, 大西祥史, 北出祐, 谷真宏, 佐藤研治
日本音響学会研究発表会講演論文集(CD-ROM) 2010 2010年
法廷における音声認識システムの開発-オンライン話者適応の構成-
大西祥史, 江森正, 谷真宏, 北出祐, 長友健太郎, 越仲孝文, 佐藤研治
日本音響学会研究発表会講演論文集(CD-ROM) 2010 2010年
法廷における音声認識システムの開発-閲覧性向上のための諸技術の開発-
北出祐, 大西祥史, 江森正, 谷真宏, 越仲孝文, 佐藤研治
日本音響学会研究発表会講演論文集(CD-ROM) 2010 2010年
法廷における音声認識システムの開発-複数マイクロフォンを用いた音声検出-
江森正, 辻川剛範, 大西祥史, 越仲孝文, 谷真宏, 北出祐, 佐藤研治
日本音響学会研究発表会講演論文集(CD-ROM) 2010 2010年
濱中悠三, 江森正, 越仲孝文, 越仲孝文, 篠田浩一, 古井貞煕
電子情報通信学会技術研究報告 109 ( 355(NLC2009 12-32) ) 19 - 23 2009年12月
濱中 悠三, 江森 正, 越仲 孝文, 篠田 浩一, 古井 貞熙
音声言語情報処理(SLP) 2009 ( 4 ) 1 - 5 2009年12月
エルゴードHMMを用いたオンライン話者クラスタリングおよび議事録作成への応用
越仲孝文, 長友健太郎, 寺西博人
音声ドキュメント処理ワークショップ講演論文集 3rd ( 376(MVE2009 79-129) ) 53 - 58 2009年
音声認識のためのコミッティを用いた能動学習
濱中悠三, 江森正, 越仲孝文, 越仲孝文, 篠田浩一, 古井貞熙
日本音響学会研究発表会講演論文集(CD-ROM) 2009 2009年
エルゴードHMMのインクリメンタル学習によるオンライン話者クラスタリング
越仲孝文, 長友健太郎, 佐藤研治
日本音響学会研究発表会講演論文集(CD-ROM) 2008 2008年
谷真宏, 江森正, 大西祥史, 越仲孝文, 篠田浩一
情報処理学会研究報告 2007 ( 129(SLP-69) ) 85 - 89 2007年12月
谷 真宏, 江森 正, 大西 祥史, 越仲 孝文, 篠田 浩一
電子情報通信学会技術研究報告. SP, 音声 107 ( 406 ) 85 - 89 2007年12月
WEB文書を活用したニュース映像検索システム
寺尾真, 越仲孝文, 安藤真一, 磯谷亮輔, 奥村明俊
音声ドキュメント処理ワークショップ講演論文集 1st 2007年
映像コンテンツと関連文書の連携によるシーン検索システム
寺尾真, 越仲孝文, 安藤真一, 磯谷亮輔, 奥村明俊
情報科学技術フォーラム FIT 2006 ( 2 ) 373 - 374 2006年8月
話し言葉における発話速度を隠れ変数にもつ継続時間長モデル
越仲孝文
日本音響学会研究発表会講演論文集 2005 2005年
越仲 孝文, 磯 健一, 奥村 明俊
情報処理学会研究報告音声言語情報処理(SLP) 2004 ( 57 ) 49 - 54 2004年5月
越仲孝文, 磯健一, 奥村明俊
電子情報通信学会技術研究報告 104 ( 87(SP2004 15-18) ) 19 - 24 2004年5月
HMMの変分ベイズ学習によるテキストの話題分割法の検討
越仲孝文, 磯健一
日本音響学会研究発表会講演論文集 2004 2004年
隣接文字間の変形の依存性を考慮した連続HMM手書き単語認識
越仲孝文, 西脇大輔, 山田敬嗣
電子情報通信学会技術研究報告 99 ( 649(PRMU99 231-245) ) 2000年
文字パタン間の依存性を考慮した文字列の学習と認識
越仲孝文, 西脇大輔, 山田敬嗣
電子情報通信学会大会講演論文集 1999 1999年
傾き推定値の信頼性評価による適応的な文字列傾き補正
越仲孝文, 西脇大輔, 山田敬嗣
電子情報通信学会大会講演論文集 1997 1997年
逆想起ニューラルネットを用いた手書きカナ認識実験
越仲孝文, 西脇大輔, 山田敬嗣
電子情報通信学会大会講演論文集 1996 ( Society D ) 1996年
特定漢数字および記号の切り出し認識法
越仲孝文, 西脇大輔, 山田敬嗣
電子情報通信学会大会講演論文集 1995 ( Sogo Pt 7 ) 1995年
機械学習を用いた胸部X線画像左右反転防止システム開発の検討
岡田圭伍, 越仲孝文, 平野高望, 本寺哲一, 安田光慶, 加藤京一
第39回日本診療放射線技師学術大会 2023年10月
NECシンガポール研究所と音声・音響解析への取組み 招待
谷 真宏, 仙田 裕三, 近藤 玲史, 越仲 孝文
情報処理学会音声言語処理研究会(SIG-SLP) 2015年10月
音で耳を測る,新しい個人認証技術 招待
越仲 孝文
センシング技術応用研究会 第201回研究例会 2017年11月
インダストリーセッション 招待
庄境 誠, 西村 雅史, 大淵 康成, 河村 聡典, 越仲 孝文
情報処理学会音声言語情報処理研究会(SIG-SLP) 2014年3月
話者認識技術の現状と課題 招待
小川 哲司, 長内 隆, 黒岩 眞吾, 越仲 孝文, 篠田 浩一, 西田 昌史
電子情報通信学会音声研究会(SP) 2013年3月
音で耳を測る,新しい個人認証技術 招待
越仲 孝文, 矢野 昌平
第6回バイオメトリクスと認識・認証シンポジウム (SBRA2016) 2016年11月
学術奨励賞
2000年3月 電子情報通信学会
音声に内在する個人性の言語的側面に関する研究
研究課題/領域番号:21K11967 2021年4月 - 2024年3月
日本学術振興会 科学研究費助成事業 基盤研究(C)
越仲 孝文
配分額:4160000円 ( 直接経費:3200000円 、 間接経費:960000円 )
本研究では、音声に含まれる個人性のうち、これまであまり研究されてこなかった言語的な個人性、すなわちテキスト情報に現れる書き手の特徴について明らかにする。研究成果は、音声通話やネット投稿のなりすましのような犯罪の防止などに有用である。
初年度は、テキストからその筆者を予測する文書分類問題を想定し、ベースラインシステムの構築に注力した。すなわち、テキストから特徴量を抽出する処理、および特徴量を所定の筆者クラスに分類する処理を実行するプログラムを作成した。前者は、基本単位であるトークンの出現頻度に基づくTF-IDF特徴量を抽出する。後者はロジスティック回帰や多層パーセプトロン(MLP)に基づく分類器である。また、特徴抽出と分類を統合した、深層ニューラルネットワークによるend-to-endシステムも構築した。こちらは長短期記憶(LSTM)機構を備える双方向リカレントニューラルネット(bidirectional RNN)および注意機構を備えるTransformerなどのモデルを含む。End-to-endシステムでは、ニューラルネットの隠れ層から入力テキストの分散表現(埋め込みベクトル)を得ることも可能である。
公開データセットである「青空文庫」から作品数の多い著名筆者10人を選び、日本語作品の段落単位での分類実験を実施した。段落総数は約33,000である。深層ニューラルネットに基づくシステムの分類精度が65%で最も高く、TF-IDF特徴量を用いる従来型システムの52%を大きく上回った。関連する研究成果を人工知能学会全国大会(JSAI2022)で発表予定。
実験の効率化のために、NVIDIA RTX A6000搭載のGPUサーバ1台を購入した。また、将来の国際会議や雑誌での論文発表に備えてLanguage Data Consortium (LDC)の音声言語データを入手した。
ベイズ統計に基づく話者の異同識別鑑定における尤度比尺度の改良
研究課題/領域番号:21510185 2009年 - 2012年
日本学術振興会 科学研究費助成事業 基盤研究(C)
長内 隆, 鎌田 敏明, 蒔苗 久則, 網野 加苗, 木下 裕子, 石原 俊一, 篠田 浩一, 黒岩 眞吾, 柘植 覚, 松井 知子, 西田 昌史, 小川 哲司, 越仲 孝文, 王 龍標
配分額:4290000円 ( 直接経費:3300000円 、 間接経費:990000円 )
法科学分野においては、裁判官らによる適切な判断を助けるために、被疑者が犯人である可能性の程度を示すことが重要である。この可能性を示すために、ベイズ統計に基づく尤度比が広く利用されている。近年、この尤度比を話者の異同識別鑑定に利用する研究が行われている。しかし、従来法では、与えられた音声資料の一部しか利用できない。本研究では、与えられた音声資料を有効に利用できる尤度比尺度を提案し、その有効性を確認した。
データマイニング
2021年4月 - 現在 機関名:横浜市立大学
音声認識
2020年12月 機関名:拓殖大学
統計と確率
2020年9月 - 現在 機関名:横浜市立大学
自然言語処理特論
2020年9月 - 現在 機関名:横浜市立大学
音声情報処理
2019年12月 - 現在 機関名:法政大学
人工知能特論
2019年11月 - 2020年11月 機関名:京都大学
データサイエンス特論
2017年11月 - 2020年11月 機関名:神戸大学
International Joint Conference on Neural Networks (IJCNN)
役割:査読
IEEE 2025年3月 - 現在
ACM Transactions on Multimedia Computing Communications and Applications
役割:査読
Association for Computing Machinery (ACM) 2023年5月 - 現在
IEEE BigData2022 Local Arrangement Co-chair
役割:企画立案・運営等
IEEE Computer Society 2022年12月
ICASSP 2022 Session Chair
役割:パネル司会・セッションチェア等
IEEE Signal Processing Society 2022年5月
APSIPA ASC 2021 Sponsorship Co-chair
役割:企画立案・運営等
Asia-Pacific Signal and Information Processing Association (APSIPA) 2021年12月
ICASSP 2021 Session Chair
役割:パネル司会・セッションチェア等
IEEE Signal Processing Society 2021年6月
ICASSP 2020 Session Chair
役割:パネル司会・セッションチェア等
IEEE Signal Processing Society 2020年5月
Computer Speech and Language
役割:査読
International Speech Communication Association (ISCA) 2019年5月 - 現在
Signal Processing Letters
役割:査読
IEEE Signal Processing Society 2019年4月 - 現在
Automatic Speech Recognition and Understanding Workshop (ASRU)
役割:査読
IEEE Signal Processing Society 2017年6月 - 現在
Spoken Language Technology Workshop (SLT)
役割:査読
IEEE Signal Processing Society 2016年6月 - 現在
情報処理学会論文誌査読委員
役割:査読
情報処理学会 2016年5月 - 現在
International Conference on Audio, Speech, and Signal Processing (ICASSP)
役割:査読
IEEE Signal Processing Society 2015年9月 - 現在
Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC)
役割:査読
Asia-Pacific Signal and Information Processing Association (APSIPA) 2015年7月 - 現在
電子情報通信学会 英文論文誌D (IEICE Trans. on Inf. & Syst.)
役割:査読
電子情報通信学会 2014年6月 - 現在
Speech Communication
役割:査読
International Speech Communication Association (ISCA) 2013年4月 - 現在
The Annual Conference of the International Speech Communication Association (INTERSPEECH)
役割:査読
International Speech Communication Association (ISCA) 2010年5月 - 現在