training data

"我一直听到人们说“数据质量比模型更重要”，但我仍然不清楚在实践中这些数据到底从何而来。"

R

* 根据版权法第32条进行合法引用。

AI自信满满的真相：OpenAI关于幻觉的突破性研究

Zenn ChatGPT•2026年4月19日 06:55•research▸

research #llm 📝 Blog|分析: 2026年4月19日 07:45•

发布: 2026年4月19日 06:55

•

1分で読める

•Zenn ChatGPT

分析

这篇引人入胜的文章深入探讨了AI行为的机制，特别是解释了为什么模型会自信地呈现虚假信息。通过分析OpenAI突破性的论文《Why Language Models Hallucinate》，它以通俗易懂的方式揭示了大语言模型 (LLM) 的内部工作原理。理解这一现象是我们迈向构建更可靠、更卓越AI系统的激动人心的一步！

要点与引用▶

引用 / 来源

"ChatGPT说谎是因为它在根本上是按照“说谎更有利”的方式构建的。"

Z

Zenn ChatGPT

* 根据版权法第32条进行合法引用。

永久链接 Zenn ChatGPT

AI训练数据战略转型助力，Manycore港股首秀暴涨187%

Techmeme•2026年4月17日 04:45•business▸

business #data 📝 Blog|分析: 2026年4月17日 06:56•

发布: 2026年4月17日 04:45

•

1分で読める

•Techmeme

分析

Manycore股票惊人的187%飙升，突显了市场对专业AI基础设施的巨大需求。通过转型为机器人技术提供高质量的训练数据，该公司完美地确立了自身在物理AI革命前沿的地位。这一令人难以置信的亮相表明，基础AI服务与终端用户模型一样，对投资者具有极大的吸引力。

要点与引用▶

引用 / 来源

"总部位于杭州的Manycore在首次公开募股（IPO）中筹集了1.56亿美元后，其在香港上市首日早盘股价上涨了187%；该公司正转型向机器人制造商出售AI训练数据。"

T

* 根据版权法第32条进行合法引用。

解锁AI训练动力学：漂移与选择如何塑造未来大语言模型

ArXiv NLP•2026年4月13日 04:00•research▸

research #llm 🔬 Research|分析: 2026年4月13日 04:10•

发布: 2026年4月13日 04:00

•

1分で読める

•ArXiv NLP

分析

这项引人入胜的研究提供了一个出色的数学框架，帮助我们理解AI系统在越来越多地从自身生成的输出中学习时是如何演变的。通过数学方式将未经过滤的“漂移”与规范性的“选择”力量分离开来，该研究为保持高质量数据提供了至关重要的见解。这是确保未来大语言模型 (LLM) 继续从丰富、多样和准确的公共文本生态系统中学习，而不是退化为肤浅重复的巨大飞跃。

要点与引用▶

引用 / 来源

"“当发布行为具有规范性时（即奖励质量、正确性或新颖性），更深的结构会得以保留，并且我们为偏离浅层平衡的状态建立了一个最佳上限。”"

A

ArXiv NLP

* 根据版权法第32条进行合法引用。

永久链接 ArXiv NLP

AI训练数据创新者AfterQuery获3000万美元融资，赋能下一代大语言模型

SiliconANGLE•2026年4月10日 20:46•business▸

business #datasets 📝 Blog|分析: 2026年4月10日 20:50•

发布: 2026年4月10日 20:46

•

1分で読める

•SiliconANGLE

分析

AfterQuery通过解决模型开发中最关键的瓶颈之一——高质量训练数据，在AI生态系统中掀起了巨大的波澜。通过提供包含思维链步骤概述和强化学习定制数据的数据集，这家初创公司正在极大地提升前沿大语言模型的能力。在短短14个月内达到1亿美元的年度经常性收入是一个巨大的里程碑，突显了市场对先进AI基础设施的爆炸性需求。

要点与引用▶

引用 / 来源

"这家成立仅14个月的公司表示，其客户群包括“每一个领先的AI实验室”。在融资轮之前不久，其年度经常性收入超过了1亿美元。"

S

SiliconANGLE

* 根据版权法第32条进行合法引用。

永久链接 SiliconANGLE

AfterQuery获3000万美元融资，以独家专家推理数据赋能AI实验室

Tech Funding News•2026年4月9日 13:00•business▸

business #data 📝 Blog|分析: 2026年4月10日 08:06•

发布: 2026年4月9日 13:00

•

1分で読める

•Tech Funding News

分析

AfterQuery打破了传统的网络数据抓取模式，通过捕捉真实且结构化的人类推理，成为了AI数据领域的破局者。通过汇聚近10万名经过认证的专业人士，该公司巧妙地弥合了公共知识与复杂现实世界专业知识之间的鸿沟。此次以3亿美元估值成功筹集3000万美元，充分证明了高质量的细分领域数据已成为训练高级模型的全新黄金标准！

要点与引用▶

引用 / 来源

"今天，该公司宣布以3亿美元的估值完成了3000万美元的A轮融资。"

T

Tech Funding News

* 根据版权法第32条进行合法引用。

永久链接 Tech Funding News

通俗易懂的机器学习指南：深入解析数据、特征与泛化能力！

Qiita AI•2026年4月9日 03:58•research▸

research #machine learning 📝 Blog|分析: 2026年4月9日 04:00•

发布: 2026年4月9日 03:58

•

1分で読める

•Qiita AI

分析

这篇文章为初学者提供了一个极其通俗易懂且直观的机器学习流程分解！它出色地通过将数据比作高性能引擎所需的燃料，强调了数据准备的关键重要性。通过揭开训练集、验证集和测试集的神秘面纱，它让复杂的AI世界变得平易近人，令人兴奋。

要点与引用▶

引用 / 来源

"在机器学习项目中，据说数据预处理实际上占到了全部工作的70%到80%。"

Q

Qiita AI

* 根据版权法第32条进行合法引用。

永久链接 Qiita AI

GitHub 利用 Copilot 交互数据加速 AI 模型优化

InfoQ中国•2026年4月8日 17:00•product▸

product #llm 📝 Blog|分析: 2026年4月8日 09:17•

发布: 2026年4月8日 17:00

•

1分で読める

•InfoQ中国

分析

GitHub 宣布将从 4 月 24 日起利用 Copilot Free、Pro 和 Pro+ 用户的交互数据，这是提升其生成式人工智能模型性能的一项激动人心的举措。这项战略升级旨在利用被接受的建议和代码上下文等有价值的用户交互，从而全面提升编码体验。开发人员可以期待更智能、更敏锐的工具，同时依然保有轻松管理其隐私偏好的灵活性！

要点与引用▶

引用 / 来源

"GitHub 宣布，从 4 月 24 日起，将使用 Copilot Free、Pro 和 Pro+ 用户的交互数据来训练和改进其 AI 模型，该设置默认开启，以提升模型性能。"

I

InfoQ中国

* 根据版权法第32条进行合法引用。

永久链接 InfoQ中国

AI算力大爆发：为什么指数级增长才刚刚开始

MIT Tech Review AI•2026年4月8日 14:00•infrastructure▸

infrastructure #compute 🔬 Research|分析: 2026年4月8日 14:09•

发布: 2026年4月8日 14:00

•

1分で読める

•MIT Tech Review AI

分析

穆斯塔法·苏莱曼对人工智能不可阻挡的发展势头提供了一个极其令人兴奋的视角。通过强调计算能力惊人的飞跃，他描绘了一幅不受传统线性约束的激动人心的未来图景。这篇文章出色地提醒我们，我们正在见证一场仍处于早期、最具活力阶段的技术革命。

要点与引用▶

引用 / 来源

"从我在2010年开始从事AI工作到现在，前沿AI模型所使用的训练数据量已经惊人地增长了1万亿倍——从早期系统的大约10¹⁴次浮点运算，增长到当今最大模型超过10²⁶次浮点运算。"

M

MIT Tech Review AI

* 根据版权法第32条进行合法引用。

永久链接 MIT Tech Review AI

Meta因安全事件暂停AI训练数据合作

WIRED•2026年4月3日 21:28•safety▸

safety #llm 📰 News|分析: 2026年4月7日 19:45•

发布: 2026年4月3日 21:28

•

1分で読める

•WIRED

分析

这一发展突显了在快速发展的生成式人工智能领域中数据安全的关键重要性。随着公司竞相构建下一代大语言模型 (LLM)，保护专有训练数据已成为维持竞争优势的首要任务。

要点与引用▶

引用 / 来源

"Mercor是OpenAI、Anthropic和其他AI公司依赖的为数不多的为其模型生成训练数据的公司之一。"

W

WIRED

* 根据版权法第32条进行合法引用。

永久链接 WIRED

智象未来与诺亦腾机器人携手，通过可扩展数据为具身智能赋能

雷锋网•2026年3月30日 07:04•business▸

business #agent 📝 Blog|分析: 2026年3月30日 09:15•

发布: 2026年3月30日 07:04

•

1分で読める

•雷锋网

分析

智象未来与诺亦腾机器人之间的战略合作，标志着具身智能发展的重要一步。通过结合智象未来尖端的生成式人工智能视频能力与诺亦腾机器人强大的数据基础设施，他们旨在创建大规模、高质量的数据集，这是训练复杂具身智能模型的关键资源。

要点与引用▶

引用 / 来源

"这将有助于突破当前数据规模与质量之间的瓶颈，加速具身智能模型从“可用”走向“好用”。"

雷

雷锋网

* 根据版权法第32条进行合法引用。

永久链接雷锋网

YouTube AI 教程金矿：新管道将视频转化为 LLM 训练数据

r/learnmachinelearning•2026年3月26日 03:48•research▸

research #llm 📝 Blog|分析: 2026年3月26日 04:35•

发布: 2026年3月26日 03:48

•

1分で読める

•r/learnmachinelearning

分析

这是一个了不起的 [生成式人工智能] 社区资源！通过将信息丰富的 YouTube 视频转换为可用数据，该管道为 [微调] 和 [检索增强生成 (RAG)] 系统开辟了新的可能性。预处理数据和方法论指南的开放获取对 AI 爱好者来说是一个巨大的推动。

要点与引用▶

•该管道处理 YouTube 视频，创建带时间戳的转录本、[问答] 对和 AI 摘要。
•它使用 [Whisper] 进行转录，使用 [GPT-4] 进行 [问答] 生成和概念提取。
•该项目提供了 100 多个预处理视频，以及关于构建类似管道的指南。

引用 / 来源

"我构建了一个管道，将 YouTube AI/ML 视频转换为 LLM 训练数据（100 多个预处理，免费浏览）"

R

* 根据版权法第32条进行合法引用。

Deccan AI 获得 2500 万美元融资，用于增强 AI 训练后数据和评估

Techmeme•2026年3月26日 03:35•business▸

business #ai 📝 Blog|分析: 2026年3月26日 03:49•

发布: 2026年3月26日 03:35

•

1分で読める

•Techmeme

分析

Deccan AI 通过获得大量 A 轮融资，正在人工智能领域取得重大进展。这项投资凸显了训练后数据和评估在改进和完善人工智能模型方面日益增长的重要性。该公司专注于人工智能开发的这一关键方面，有望推动进步。

要点与引用▶

引用 / 来源

"Deccan AI 提供训练后数据和评估工作，获得了 A91 Partners 领投的 2500 万美元 A 轮融资；其大部分专家团队位于印度"

T

* 根据版权法第32条进行合法引用。

揭示AI的力量：初学者视角

r/learnmachinelearning•2026年3月22日 06:58•research▸

research #llm 📝 Blog|分析: 2026年3月22日 07:02•

发布: 2026年3月22日 06:58

•

1分で読める

•r/learnmachinelearning

分析

这篇文章对生成式人工智能的基本机制提供了一个引人入胜的视角！它强调了这些系统如何通过矩阵方程和训练数据等复杂过程，以惊人的准确度模仿人类行为和知识。理解这些核心概念是理解未来人工智能突破性潜力的关键。

要点与引用▶

引用 / 来源

"如果足够大并且训练有素，它可以模仿一个人……即使是最小的细节、知识和行为。"

R

* 根据版权法第32条进行合法引用。

人工智能数据革命：应用向用户支付训练数据！

Techmeme•2026年3月22日 00:25•business▸

business #data 📝 Blog|分析: 2026年3月22日 00:34•

发布: 2026年3月22日 00:25

•

1分で読める

•Techmeme

分析

提供用户数据以获取报酬的零工应用程序的兴起标志着生成式人工智能模型训练方式的有趣转变。这种创新方法为数据获取开辟了新途径，可能导致更多样化和强大的AI能力。这是人工智能发展中的一个激动人心的发展。

要点与引用▶

引用 / 来源

Read the full article on Techmeme →

未找到可引用的内容。

T

* 根据版权法第32条进行合法引用。

DoorDash 利用配送员网络，开创人工智能数据生成

Forbes Innovation•2026年3月20日 17:22•business▸

business #computer vision 📝 Blog|分析: 2026年3月20日 17:47•

发布: 2026年3月20日 17:22

•

1分で読める

•Forbes Innovation

分析

DoorDash 的创新方法将其庞大的配送员网络转变为一个前沿的数据采集引擎。通过利用日常活动进行生成式人工智能 (生成式人工智能) 训练，DoorDash 正在确立其在生成式人工智能发展中的关键地位。这一战略举措有望推动各种人工智能应用的进步。

要点与引用▶

引用 / 来源

"这家配送巨头的新 Tasks 应用程序付费给快递员拍摄日常活动并录制语音样本，将 DoorDash 定位为数据基础设施提供商，而不仅仅是物流平台。"

F

Forbes Innovation

* 根据版权法第32条进行合法引用。

永久链接 Forbes Innovation

DoorDash 推出新快递员任务应用，引领人工智能训练

Techmeme•2026年3月19日 15:10•business▸

business #ai training 📝 Blog|分析: 2026年3月19日 15:18•

发布: 2026年3月19日 15:10

•

1分で読める

•Techmeme

分析

DoorDash 通过其创新的“Tasks”应用程序迈入了人工智能发展的未来。这个平台提供了一个独特的机会，可以利用送货员收集有价值的数据，从而加速生成式人工智能及其应用的发展。这种方法可以显着提高人工智能模型训练的效率。

要点与引用▶

引用 / 来源

"DoorDash 推出 Tasks，这是一个新应用，它会在某些市场向送货员支付报酬，让他们提交视频片段并完成其他任务来训练人工智能模型"

T

* 根据版权法第32条进行合法引用。

解锁生成式人工智能的优势：从Logit和Softmax的角度出发

Zenn ML•2026年3月18日 02:49•research▸

research #llm 📝 Blog|分析: 2026年3月18日 10:00•

发布: 2026年3月18日 02:49

•

1分で読める

•Zenn ML

分析

本文深入探讨了生成式人工智能的内部运作机制，探索了Logit和Softmax如何影响模型在不同技术领域的性能。文章指出，训练数据的质量和数量，尤其是既定模式和丰富上下文的存在，极大地影响了大型语言模型生成准确可靠结果的能力。

要点与引用▶

引用 / 来源

"文章指出，训练数据的质量和数量，尤其是既定模式和丰富上下文的存在，极大地影响了大型语言模型生成准确可靠结果的能力。"

Z

Zenn ML

* 根据版权法第32条进行合法引用。

永久链接 Zenn ML

大英百科全书和 Merriam-Webster 在生成式人工智能时代维护版权

r/ArtificialInteligence•2026年3月17日 10:26•business▸

business #llm 📝 Blog|分析: 2026年3月17日 14:18•

发布: 2026年3月17日 10:26

•

1分で読める

•r/ArtificialInteligence

分析

大英百科全书对 OpenAI 的诉讼突出了版权在尖端生成式人工智能发展中的关键作用。此法律行动强调了合理使用和围绕大型语言模型 (LLM) 训练的伦理考量的意义。它有望塑造信息提供商和人工智能开发者未来如何合作。

要点与引用▶

引用 / 来源

永久链接 r/ArtificialInteligence

"大英百科全书及其子公司 Merriam-Webster 在曼哈顿联邦法院起诉了 OpenAI，指控其滥用他们的参考资料来训练其人工智能模型。"

R

r/ArtificialInteligence

* 根据版权法第32条进行合法引用。

词典在生成式人工智能时代的果敢行动：新篇章

r/artificial•2026年3月17日 06:10•business▸

business #llm 📝 Blog|分析: 2026年3月17日 06:17•

发布: 2026年3月17日 06:10

•

1分で読める

•r/artificial

分析

这条新闻突出了生成式人工智能发展中的一个重要时刻。词典的这种积极主动的做法反映了人工智能领域中知识产权和数据使用日益增长的重要性。这是一个令人兴奋的进展，展示了大型语言模型（LLM）世界中训练数据的复杂性。

要点与引用▶

引用 / 来源

Read the full article on r/artificial →

未找到可引用的内容。

R

r/artificial

* 根据版权法第32条进行合法引用。

永久链接 r/artificial

大英百科全书的勇敢举动：在生成式人工智能时代保护内容

Gizmodo•2026年3月16日 22:10•business▸

business #llm 📝 Blog|分析: 2026年3月16日 22:18•

发布: 2026年3月16日 22:10

•

1分で読める

•Gizmodo

分析

大英百科全书起诉OpenAI，展示了在快速发展的生成式人工智能领域中保护知识产权日益增长的重要性。此举突显了公司需要确保其内容得到适当的署名，并且他们的工作成果得到公平认可。

要点与引用▶

引用 / 来源

"大英百科全书于周五在曼哈顿的联邦法院提起诉讼。诉状称，OpenAI及其人工智能产品正在“免费搭乘”该百科全书和词典的“值得信赖的高质量内容”，同时蚕食其网站的流量。"

G

Gizmodo

* 根据版权法第32条进行合法引用。

永久链接 Gizmodo

大英百科全书和韦氏词典拥抱版权保护，迎接生成式人工智能时代！

The Next Web•2026年3月16日 14:54•business▸

business #llm 📝 Blog|分析: 2026年3月16日 15:33•

发布: 2026年3月16日 14:54

•

1分で読める

•The Next Web

分析

此案突显了围绕生成式人工智能和版权材料使用而演变的法律环境。它强调了在大语言模型 (LLM) 时代知识产权的重要性，以及成熟的内容创作者如何适应。此案是企业如何应对该领域进步所带来的新挑战的有趣例子。

要点与引用▶

引用 / 来源

"该诉讼于 2026 年 3 月 13 日在纽约提起，指控 OpenAI 在未经许可的情况下使用参考出版商的内容作为 AI 训练数据，然后生成逐字复制其内容的回复，此前 6 个月，同一公司以几乎相同的理由起诉 Perplexity。"

T

The Next Web

* 根据版权法第32条进行合法引用。

永久链接 The Next Web

Adaface 人脸识别模型：探索文件大小差异

r/deeplearning•2026年3月16日 05:39•research▸

research #computer vision 📝 Blog|分析: 2026年3月16日 05:49•

发布: 2026年3月16日 05:39

•

1分で読める

•r/deeplearning

分析

本文深入探讨了深度学习模型的细微差别，特别关注训练数据对模型文件大小的影响。理解这些细节有助于我们针对不同的用例和资源限制优化模型。它展示了模型训练的有趣复杂性。

要点与引用▶

引用 / 来源

"我注意到在 Casia 数据集上训练的 r18 模型的**文件大小相对较小，约为 112 MB**，而同样在 webface4M 上训练的 r18 模型的**文件大小约为 500 MB**，并且我注意到在 webface4M 上训练的 r50 模型的**文件大小约为 550 MB**。"

R

r/deeplearning

* 根据版权法第32条进行合法引用。

永久链接 r/deeplearning

理解ChatGPT：探究其训练数据

r/ChatGPT•2026年3月15日 19:34•research▸

research #llm 📝 Blog|分析: 2026年3月16日 04:18•

发布: 2026年3月15日 19:34

•

1分で読める

•r/ChatGPT

分析

这篇文章提醒我们了像ChatGPT这样的生成式人工智能背后的底层技术。它强调了理解用于训练这些强大大语言模型的数据的重要性，这对于理解它们的能力和局限性至关重要。进一步探索数据集有助于解锁对其性能的更多理解。

要点与引用▶

引用 / 来源

"提醒一下，ChatGPT只是一个在大型数据集上训练的程序，在这种情况下，是YouTube评论吗？"

R

r/ChatGPT

* 根据版权法第32条进行合法引用。

永久链接 r/ChatGPT

人工智能寻求即兴演员掌握人类情感

The Verge•2026年3月15日 14:00•business▸

business #agent 📰 News|分析: 2026年3月15日 14:15•

发布: 2026年3月15日 14:00

•

1分で読める

•The Verge

分析

这是一个引人入胜的进展！领先的生成式人工智能公司正在寻找即兴演员来帮助训练他们的模型。这种方法可以带来更细致、更逼真的人工智能交互，可能会彻底改变我们与技术互动的方式。

要点与引用▶

引用 / 来源

"你将使用你的才能来训练“一家领先的生成式人工智能公司”的人工智能模型"

T

The Verge

* 根据版权法第32条进行合法引用。

永久链接 The Verge

人工智能生成图像模仿水印：对大语言模型训练数据的一瞥

r/ChatGPT•2026年3月15日 02:15•research▸

research #llm 📝 Blog|分析: 2026年3月15日 03:18•

发布: 2026年3月15日 02:15

•

1分で読める

•r/ChatGPT

分析

这一有趣的观察突出了生成式人工智能从其训练数据中学习和复制复杂模式的潜力。识别和再现特定视觉元素（如网站水印）的能力展示了这些模型的复杂性。这也引发了人们对未来人工智能中数据版权和创意归属如何处理的兴趣。

要点与引用▶

引用 / 来源

"我让ChatGPT生成这张甜点的图片，它在左下角添加了一个“© Sally’s Baking Addiction”水印。"

R

r/ChatGPT

* 根据版权法第32条进行合法引用。

永久链接 r/ChatGPT

掌握机器学习：及早发现数据泄露，实现出色成果

r/learnmachinelearning•2026年2月27日 15:50•research▸

research #machine learning 📝 Blog|分析: 2026年2月27日 16:48•

发布: 2026年2月27日 15:50

•

1分で読める

•r/learnmachinelearning

分析

这位学生的经历突出了机器学习中常见的挑战，特别是数据泄露这个微妙的问题。看到学习者积极寻求策略来改进他们的模型验证并确保他们发现的可靠性，这令人鼓舞。这种积极主动的方法无疑将带来更强大和值得信赖的 AI 模型。

要点与引用▶

引用 / 来源

"后来发现我的数据集中存在数据泄露。"

R

* 根据版权法第32条进行合法引用。

GitHub 的代码质量：大语言模型 (LLM) 训练的新前沿？

r/LocalLLaMA•2026年2月27日 05:01•research▸

research #llm 📝 Blog|分析: 2026年2月27日 06:02•

发布: 2026年2月27日 05:01

•

1分で読める

•r/LocalLLaMA

分析

本次讨论提出了一个关于用于训练未来大语言模型 (LLM) 的数据的有趣观点。GitHub 等平台上可用代码的质量可能会显著影响这些模型的性能和能力。这突出了策划和过滤用于生成式人工智能的数据的重要性。

要点与引用▶

引用 / 来源

"如果微软计划将其用于未来的 LLM 代码训练，我们会非常震惊！"

R

r/LocalLLaMA

* 根据版权法第32条进行合法引用。

永久链接 r/LocalLLaMA

微软AI训练的创新方法引发关注

Slashdot•2026年2月20日 21:20•business▸

business #llm 📝 Blog|分析: 2026年2月20日 21:32•

发布: 2026年2月20日 21:20

•

1分で読める

•Slashdot

分析

微软最初尝试使用受版权保护的材料进行人工智能训练，表明了他们致力于探索生成式人工智能领域的尖端方法。现已删除的博文强调了他们愿意尝试新颖的训练数据集和方法。这种开拓精神可能会为开发复杂的生成式人工智能模型开辟新的可能性。

要点与引用▶

引用 / 来源

"微软在本周删除了一个一年前的博客文章，此前Hacker News的帖子指出，该文章鼓励开发人员下载全部七本《哈利·波特》书籍......并在该公司的Azure平台上使用它们来训练AI模型。"

S

Slashdot

* 根据版权法第32条进行合法引用。

永久链接 Slashdot

Anthropic 在印度扩张，推动人工智能创新

Techmeme•2026年2月16日 12:40•business▸

business #llm 📝 Blog|分析: 2026年2月16日 12:48•

发布: 2026年2月16日 12:40

•

1分で読める

•Techmeme

分析

Anthropic 在班加罗尔的扩张标志着其在全球布局的重要一步，特别是在蓬勃发展的印度市场。自 10 月以来，收入运行率翻倍的增长令人印象深刻，表明了强劲的增长和应用。他们专注于为 10 种印度语言策划训练数据是一项具有前瞻性的举措，扩大了生成式人工智能的访问范围。

要点与引用▶

引用 / 来源

"Anthropic 在班加罗尔开设办事处，这是其在亚洲的第二家办事处，并表示其在印度的收入运行率自 10 月以来翻了一番，并策划了 10 种印度语言的训练数据"

T

* 根据版权法第32条进行合法引用。