微调Mobius 12B base模型记录
微调Mobius 12B base模型,会涉及以下步骤。
- 安装必要的库。如果你还没安装,首先需要安装Hugging Face的Transformers库,pip install transformers`来进行安装。
- 加载预训练的模型和分词器。如我之前提到的,你可以用以下代码加载模型和分词器:
ai大模型最新排行榜
ai大模型最新排行榜
1 SuperCLUE总排行榜(2024年2月)
排名 | 模型名称 | 机构 | 总分 | OPEN | OPT | 使用 | 发布日期 |
---|---|---|---|---|---|---|---|
- | GPT4-Turbo-0125 | OpenAI | 92.71 | 94.95 | 83.74 | API | 2024年2月27日 |
- | GPT4(网页) | OpenAI | 90.36 | 91.48 | 85.89 | 网页 | 2024年2月27日 |
🏅 | 文心一言4.0 | 百度 | 87.75 | 88.23 | 85.82 | API | 2024年2月27日 |
🥈 | GLM-4 | 清华&智谱AI | 86.77 | 87.49 | 83.89 | API | 2024年2月27日 |
🥉 | 通义千问2.1 | 阿里巴巴 | 85.7 | 86.1 | 84.09 | API | 2024年2月27日 |
4 | Baichuan3 | 百川智能 | 82.59 | 82.45 | 83.13 | API | 2024年2月27日 |
5 | Moonshot(KimiChat) | 月之暗面 | 82.37 | 82.29 | 82.66 | 网页 | 2024年2月27日 |
6 | 讯飞星火V3.5 | 科大讯飞 | 81.01 | 80.6 | 82.64 | API | 2024年2月27日 |
7 | qwen1.5-72b-chat | 阿里巴巴 | 79.36 | 78.39 | 83.22 | API | 2024年2月27日 |
8 | MiniMax_Abab6 | 稀宇科技 | 78.01 | 77.94 | 78.29 | API | 2024年2月27日 |
9 | 云雀大模型 | 字节跳动 | 76.58 | 75.47 | 81.04 | API | 2024年2月27日 |
10 | 从容大模型V1.5 | 云从科技 | 75.56 | 75.69 | 75.03 | API | 2024年2月27日 |
10 | 360gpt-pro | 360 | 75.54 | 74.1 | 81.3 | API | 2024年2月27日 |
12 | XVERSE-65B-Chat | 元象科技 | 74.64 | 74.15 | 76.57 | API | 2024年2月27日 |
- | Claude2 | Anthropic | 72.51 | 72.9 | 70.92 | API | 2024年2月27日 |
13 | qwen1.5-14b-chat | 阿里巴巴 | 70.32 | 67.9 | 79.99 | API | 2024年2月27日 |
- | GPT3.5-Turbo-0125 | OpenAI | 64.34 | 63.26 | 68.68 | API | 2024年2月27日 |
14 | Yi-34B-Chat | 零一万物 | 63.5 | 59.99 | 77.52 | 模型 | 2024年2月27日 |
- | Gemini-Pro | 62.57 | 58.96 | 77.01 | API | 2024年2月27日 | |
15 | qwen1.5-7b-chat | 阿里巴巴 | 60.88 | 57.7 | 73.56 | API | 2024年2月27日 |
16 | qwen-14b-chat | 阿里巴巴 | 59.73 | 54.98 | 78.72 | API | 2024年2月27日 |
17 | Baichuan2-13B-Chat | 百川智能 | 57.28 | 53.99 | 70.44 | 模型 | 2024年2月27日 |
18 | XVERSE-13B-L | 元象科技 | 51.07 | 45.34 | 74.02 | API | 2024年2月27日 |
19 | MiniCPM-2B | 面壁智能 | 40.66 | 34.86 | 63.86 | API | 2024年2月27日 |
20 | ChatGLM3-6B | 清华&智谱AI | 40.32 | 34.33 | 64.3 | 模型 | 2024年2月27日 |
2 其它特色ai链接:
2.1 多模型竞答对比:Chat with Open Large Language Models (lmsys.org)
lmsys支持多种模型:
Video-retalking、Wav2lip、SadTalker、GeneFace对比
MuseTalk一键整合包下载
MuseTalk一键整合包
1 环境安装
下面是官方安装:
video-retalking一键整合包下载
video-retalking一键整合包
1 环境安装
下面是官方安装:
facechain- stable diffusion讨论 方案实现
AI stable diffusion和 facechain
20230916讨论.md
project_facechain/1.讨论 at main · hit-perfect/project_facechain (github.com)
1 目前计划实现的内容
导入拍摄好的图片,通过AI处理提取人脸、身形等关键信息
Faster_Whisper部署教快速入门教程
1 Faster_Whisper优点
Faster_Whisper是基于OpenAI的Whisper模型的高效实现。主要包括以下特点:
- 更高效:其利用CTranslate2,一个专为Transformer模型设计的快速推理引擎。这种实现既提高了语音识别的速度,同时还优化了内存使用效率。
- 稳定性:Faster-Whisper的核心优势在于其能够在保持原有模型准确度的同时,大幅提升处理速度。
- 可用性:减少模型的层数、参数量和模型结构,这样就减少了计算量和内存消耗,并改进了推理算法和计算过程,减少了冗余计算,进一步提高了模型的运行速度。
适用场景主要包括:语音识别、语音转写、大规模语音数据处理等。在处理大规模的语音数据时,因为其高效的计算能力和优秀的内存优化,使得Faster_Whisper得到了广泛应用