标签: deep-learning

All the articles with the tag "deep-learning".

DeepSeek R1：重写AI训练规则
Published:Jan 22, 2025 at 10:00 AM
发现 DeepSeek R1 如何通过在有监督数据为零的情况下在 AIME 上达到 71% 的准确率，颠覆了 AI 训练的范式。这一突破揭示了纯强化学习如何自发发展高级推理能力，可能消除庞大的数据需求并实现 AI 开发的民主化。对于寻求模型训练技术下一步演进的 ML 工程师和 AI 研究人员来说，这是一篇必读之作。
序列到序列学习——神经网络十年
Published:Dec 31, 2024 at 03:22 PM
探讨 Ilya Sutskever 对序列到序列学习十年进展的反思，检视神经网络的演变及其对 AI 开发未来的影响。
优化大型语言模型
Published:Jan 15, 2024 at 03:22 PM
优化大型语言模型 (LLMs) 以获得更好性能的技术指南，涵盖降低计算成本、提高推理速度和增强模型效率的技术。
深入循环神经网络
Published:Dec 15, 2023 at 03:22 PM
对循环神经网络（RNNs）的全面技术分析，涵盖架构、实现、训练技术以及在序列处理任务中的应用。

DeepSeek R1：重写AI训练规则