Hate speech News & Updates | AI.jp.net

制御可能なテキスト生成モデルを使用したLLM統合型自動ヘイトスピーチ認識

AI Research #Natural Language Processing, Hate Speech Detection 🔬 Research|分析: 2026年1月16日 01:52•

公開: 2026年1月9日 05:00

•

1分で読める

•ArXiv Audio Speech

分析

この記事は、制御可能なテキスト生成モデルを利用して、大規模言語モデル (LLM) を統合した自動ヘイトスピーチ認識について議論しています。このアプローチは、テキスト内のヘイトコンテンツを特定し、潜在的に軽減するための新しい方法を示唆しています。具体的な方法とその有効性を理解するには、さらなる詳細が必要です。

重要ポイント

引用・出典

原文を見る

"LLMs-Integrated Automatic Hate Speech Recognition Using Controllable Text Generation Models"

A

ArXiv Audio Speech

* 著作権法第32条に基づく適法な引用です。

固定リンク ArXiv Audio Speech

MultiHateLoc：オンライン動画におけるマルチモーダルヘイトコンテンツの時系列局在化

Research #Hate Speech 🔬 Research|分析: 2026年1月10日 12:04•

公開: 2025年12月11日 08:18

•

1分で読める

•ArXiv

分析

この研究論文は、マルチモーダルAIを使用して、オンラインビデオ内のヘイトスピーチを特定し、位置を特定するという困難な問題を探求しています。この研究は、有害なコンテンツを検出するための技術的解決策を提供することにより、コンテンツモデレーションとオンラインの安全性の向上に貢献する可能性があります。

重要ポイント

引用・出典

原文を見る

"The paper focuses on the temporal localization of multimodal hate content."

A

ArXiv

* 著作権法第32条に基づく適法な引用です。

固定リンク ArXiv

LLMの信頼性再評価：大規模言語モデルはヘイトスピーチを正確に検出できるか？

Research #LLM 🔬 Research|分析: 2026年1月10日 12:19•

公開: 2025年12月10日 14:00

•

1分で読める

•ArXiv

分析

この研究は、大規模言語モデル（LLM）が完全には注釈できない概念を評価する能力に焦点を当て、ヘイトスピーチ検出におけるLLMの限界を探求しています。この研究は、この乖離が重要なアプリケーションにおけるLLMの信頼性に与える影響を調査する可能性が高いです。

重要ポイント

引用・出典

原文を見る

"The study investigates LLM reliability in the context of hate speech detection."

A

ArXiv

* 著作権法第32条に基づく適法な引用です。

固定リンク ArXiv

細粒度中国語ヘイトスピーチ検出：プロンプト駆動型LLMマージアプローチ

Research #LLM 🔬 Research|分析: 2026年1月10日 12:21•

公開: 2025年12月10日 11:58

•

1分で読める

•ArXiv

分析

本研究は、オンラインの有害性を軽減するために重要な、中国語における細粒度ヘイトスピーチ検出を強化するための大規模言語モデル（LLM）の統合を探求しています。統合されたLLMのプロンプトエンジニアリングへの依存は、多様なデータ分布全体におけるその堅牢性と一般化可能性についてさらなる調査を必要とします。