News
MOU/パートナーシップ , 実績
ダークウェブNLP論文:世界的に最も権威のある学会「NAACL 2022」で採択
2022.07.12

世界の問題を高い技術力で解決するデータインテリジェンス企業S2Wが本日、米シアトルで開催された世界で最も権威のある自然語処理(NLP)学会「NAACL(北米計算言語学会) 2022」でダークウェブの言語に関する分析論文を発表しました。

*「NAACL(North American Chapter of the Association for Computational Linguistics)」は、「ACL」、「EMNLP」とともに世界3大NLP学会として知られています。

「ダークウェブの言語に新たな光を照らす(Shedding New Light on the Language of the Dark Web)」をテーマにした論文には、ダークウェブに登場する言語を収集・分析し、一般的なインターネット言語と比較した研究結果が収められています。

Title: Shedding New Light on the Language of the Dark Web
Conference: NAACL 2022
著者: Youngjin Jin(KAIST)、Eugene Jang(S2W Inc.)、Yongjae Lee(S2W Inc.)、Seungwon Shin(KAIST)、Jin-Woo Chung(S2W Inc.)

レポート詳細は、こちらからご確認いただけます。

S2Wは、ダークウェブだけでなく、さまざまな分野でデータを分析する際に、AI分野のひとつであるNLP技術を随所に適用しています。単純な言語分析を超え、ディープラーニング分野までかけ合わせるNLP技術を駆使して、さらに多様な分野に貢献できるように努力していきます。

また、ダークウェブのウェブドキュメントを10種類のカテゴリーに分類するために使用した分類モデルと学習データを公開しました。

その内容は論文の中で最も興味深いテーマで、「テスラ」「トヨタ」などの自動車ブランド名がダークウェブでしばしば麻薬を指す隠語として使われることなどが『毎日経済』と『IT Daily』などのメディアを通じて報道されています。

一覧