<aside> 🗓️

2025/02/08 SAT ☀

</aside>

2025_01_Jan_Run LLM Locally 01_What is LLM.webp

本地运行大语言模型 1 - 什么是大模型

什么是大语言模型

大语言模型（LLM, Large Language Model）是一种人工智能（AI）模型，经过大量文本数据的训练，以复杂的方式理解、生成和处理人类语言。这些模型基于深度学习架构，通常使用Transformers架构，如GPT、BERT等。

大语言模型示例

一些知名的大语言模型包括：

GPT-4 / GPT-3.5（由OpenAI开发） – 用于ChatGPT，能够理解和生成复杂的语言响应。
Claude（由Anthropic开发） – 专注于人工智能安全性和可解释性。
LLaMA（由Meta开发） – 针对效率优化的开源大语言模型。
Gemini（由Google DeepMind开发） – 集成文本、图像等多模态AI模型。

大语言模型可以做什么

如今，大语言模型已经被应用于多个领域，包括：

聊天机器人和虚拟助手 – 像ChatGPT、Google Gemini和客户服务机器人这样的AI聊天系统。
内容生成 – 撰写文章、摘要、产品描述和创意写作。
代码辅助 – 像GitHub Copilot这样的AI编码助手帮助开发者编写和调试代码。
翻译与转录 – 自动语言翻译和语音转文本转换。
医疗与法律分析 – AI模型协助总结和分析复杂文档。