AIHOT

全部动态资讯 · 1322 条

全部一手资讯 X 论文

9月9日周五

6月10日周五

4月16日周六

2月20日周日

12月5日周日

9月24日周五

7月11日周日

5月31日周一

4月24日周六

3月21日周日

1月2日周六

10月29日周四

8月6日周四

6月7日周日

5月16日周六

4月7日周二

1月29日周三

11月10日周日

9月5日周四

6月23日周日

5月5日周日

3月14日周四

1月31日周四

12月27日周四

11月30日周五

10月13日周六

8月12日周日

6月24日周日

5月5日周六

4月8日周日

2月19日周一

1月23日周二

12月31日周日

12月15日周五

10月29日周日

10月15日周日

9月28日周四

8月20日周日

8月1日周二

7月22日周六

9月9日

01:00

Lilian Weng：Lil'Log（RSS）

神经正切核背后的数学原理

神经正切核是一种用于解释神经网络在梯度下降训练过程中演化行为的核方法。它深入阐释了为何宽度足够的神经网络能够一致收敛至经验损失函数的全局最小值，即使在参数量远超训练样本数的过参数化情况下亦是如此。研究进一步探讨了在神经网络具有无限宽度的设定下，通过刻画神经正切核来证明其在不同初始化条件下能够确定性收敛的理论依据。

arXiv教程/实践数据/训练

6月10日

06:10

Lilian Weng：Lil'Log（RSS）

通用视觉语言模型

处理图像生成文本（如图像描述和视觉问答）的技术已有多年研究。传统方法通常依赖目标检测网络作为视觉编码器来捕捉视觉特征，再通过文本解码器生成文字。该内容聚焦于一种特定的技术路径，即扩展预训练的通用语言模型，使其具备处理视觉信号的能力，从而完成视觉语言任务。

图像生成多模态教程/实践

4月16日

06:10

Lilian Weng：Lil'Log（RSS）

数据不足下的学习第三部分：数据生成

在训练数据有限的情况下，文章探讨了两种生成合成数据的核心方法。一是数据增强，通过对现有样本施加变换、扭曲等操作生成新数据点，同时保持关键属性不变，这种方法在文本和图像领域已有较多应用。二是生成全新数据，尤其依赖强大的预训练语言模型（如GPT、LLaMA），在极少甚至没有原始数据时，能够通过上下文学习生成高质量的合成数据点，显著拓展了小样本学习的可能性。

教程/实践数据/训练

2月20日

08:00

Lilian Weng：Lil'Log（RSS）

精选57

数据不足情况下的学习第二部分：主动学习

监督学习任务的性能依赖于高质量标注数据，但获取大量标注样本成本高昂。主动学习是一种在标注预算有限、但允许投入部分人工标注资源的条件下，应对标注数据不足的范式。其核心思路是智能地选择最具信息量的样本进行标注，以在有限预算内最大化模型性能的提升。该方法旨在解决当面临标注数据受限时，如何通过策略性采样来高效利用标注资源的问题。

教程/实践数据/训练

推荐理由：这是 Lilian Weng 数据不足系列的第二篇，把主动学习的核心采样策略和实际权衡讲得很清楚，做数据标注和 ML 工程的同学值得复习一遍。

12月5日