文章專區

2025-03-19大型語言模型的訓練素材從哪裡來? 519 期

Author 作者 編輯部

伴隨人工智慧(artificial intelligence, AI)與大型語言模型(large language model, LLM)的蓬勃發展,各大語言模型所需的訓練素材來源也逐漸受到眾人關注。訓練LLM需要使用龐大素材,現今網路資料如洪流,各公司如何從中擷取有用的材料?是否會衍伸著作權問題?合理使用的界線又該劃在哪裡?當LLM的研發與使用成本漸漸降低,如何確保訓練素材的開放性與高品質,或許將成為LLM能否平民化的關鍵。