互联网的高质量文本几乎被"吃光"了,AI训练面临数据枯竭 2026年,AI行业面临一个日益严峻的问题:互联网上可用的高质量文本数据几乎被大模型"吃光"了。据Epoch AI研究,高质量文本训练数据可能在2026年至2030年间完全耗尽。更令人担忧的是,低质量数据填充带来的模型性能下降效应已经开始显现