甘南第一勇士
04
14
基于Llama的藏文增量预训练及模型开源共享 基于Llama的藏文增量预训练及模型开源共享
一、ChatGPT简要技术回顾为何出圈:不再是传统意义的人机对话系统,而是以自然语言为交互方式的通用语言处理平台。 技术有突破:基础数据+核心模型+优化算法 应用接地气:几乎可以完成所有语言相关的功能 效果超预期:相比于先前系统效果产生
2024-04-14 沙九
14
14
大模型应用的平民化 大模型应用的平民化
一、任务    使用llama.cpp量化部署:以llama.cpp工具为例,介绍模型量化并在本地部署的详细步骤。Windows则可能需要cmake等编译工具的安装。本地快速部署体验推荐使用经过指令精调的
2024-04-14 沙九
14
面向大语言模型的藏语指令数据集构建 面向大语言模型的藏语指令数据集构建
面向大语言模型的藏语指令数据集构建 论文题目:面向大语言模型的藏语指令数据集构建 作者机构:北方工业大学;百度网讯科技有限公司;北京理工大学 1. 摘要    指令微调被认为是增强大语言模型(LL
2024-04-14 沙九
s's