分类: 大模型 | 沙九的博客

沙九的博客

北京理工大学 | 计算机科学与技术 | 自然语言处理

甘南第一勇士

文章分类

语言 2 个人提升 6 工具收录 4 工具方法 3 语言(Python) 3 大模型 3 语言(java) 1 语言(Linux) 1 语言(Markdown) 1 语言(oracle) 1 学习记录 2 语言(mysql) 1 语言(Java) 2 算法 1 周总结(BERT) 1 语言(MyBatis) 1 信息抽取 1 周总结 3 机器翻译 1 语言(SpringBoot) 1 CV 1

                            
                            大语言模型(LLM)微调方法总结
                        
                                大语言模型(LLM)微调方法总结一、引言$\quad$在预训练后，大模型可以获得解决各种任务的通用能力。然而，越来越多的研究表明，大语言模型的能力可以根据特定目标进一步调整。降低大模型微调成本，由于模型规模的增大，传统微调的方法变得难以实现
                            
                                2023-05-18
                            
                                    大模型
                                
                            专业
                        
                            SELF-INSTRUCT：将语言模型与自生成指令对齐
                        
                                一、引言$\quad$随着大规模语言模型(LLM)的能力范围越来越广，其中有两个关键的组成部分: 大型预训练语言模型(LM) 和人类书写的指令数据。然而，①现有指令微调严重依赖于人编写的指令数据，这些数据在规模、多样性和创造性等方面都受限，
                            
                                2023-04-08
                            
                                    大模型
                                
                            专业
                        
                            总结GPT系列以及ChatGPT训练步骤
                        
                                总结GPT系列以及ChatGPT训练步骤一、引言$\quad$ 近期ChatGPT在大众眼里的热度越来越热，它Prompt出了我的焦虑，于是最近一直在补大模型相关的工作。另外，北京市经济和信息化局在北京人工智能产业创新发展大会上，其中提到支
                            
                                2023-04-08
                            
                                    大模型
                                
                            专业

s's