ai大模型最新排行榜

ai大模型最新排行榜

https://wd-jishu.oss-cn-hangzhou.aliyuncs.com/img/image-20240401162721324.png@!full

排名模型名称机构总分OPENOPT使用发布日期
-GPT4-Turbo-0125OpenAI92.7194.9583.74API2024年2月27日
-GPT4(网页)OpenAI90.3691.4885.89网页2024年2月27日
🏅文心一言4.0百度87.7588.2385.82API2024年2月27日
🥈GLM-4清华&智谱AI86.7787.4983.89API2024年2月27日
🥉通义千问2.1阿里巴巴85.786.184.09API2024年2月27日
4Baichuan3百川智能82.5982.4583.13API2024年2月27日
5Moonshot(KimiChat)月之暗面82.3782.2982.66网页2024年2月27日
6讯飞星火V3.5科大讯飞81.0180.682.64API2024年2月27日
7qwen1.5-72b-chat阿里巴巴79.3678.3983.22API2024年2月27日
8MiniMax_Abab6稀宇科技78.0177.9478.29API2024年2月27日
9云雀大模型字节跳动76.5875.4781.04API2024年2月27日
10从容大模型V1.5云从科技75.5675.6975.03API2024年2月27日
10360gpt-pro36075.5474.181.3API2024年2月27日
12XVERSE-65B-Chat元象科技74.6474.1576.57API2024年2月27日
-Claude2Anthropic72.5172.970.92API2024年2月27日
13qwen1.5-14b-chat阿里巴巴70.3267.979.99API2024年2月27日
-GPT3.5-Turbo-0125OpenAI64.3463.2668.68API2024年2月27日
14Yi-34B-Chat零一万物63.559.9977.52模型2024年2月27日
-Gemini-ProGoogle62.5758.9677.01API2024年2月27日
15qwen1.5-7b-chat阿里巴巴60.8857.773.56API2024年2月27日
16qwen-14b-chat阿里巴巴59.7354.9878.72API2024年2月27日
17Baichuan2-13B-Chat百川智能57.2853.9970.44模型2024年2月27日
18XVERSE-13B-L元象科技51.0745.3474.02API2024年2月27日
19MiniCPM-2B面壁智能40.6634.8663.86API2024年2月27日
20ChatGLM3-6B清华&智谱AI40.3234.3364.3模型2024年2月27日

lmsys支持多种模型:

Claude: Claude by AnthropicDBRX Instruct: DBRX by Databricks Mosaic AIStarling-LM-7B: An open model trained using RLAIF by Berkeley
Command-R: Command-R by CohereMixtral of experts: A Mixture-of-Experts model by Mistral AIQwen 1.5: A large language model by Alibaba Cloud
Gemini: Gemini by GoogleGPT-4-Turbo: GPT-4-Turbo by OpenAIGPT-3.5: GPT-3.5-Turbo by OpenAI
Llama 2: Open foundation and fine-tuned chat models by MetaOLMo-7B: OLMo by Allen AIGemma: Gemma by Google
Vicuna: A chat assistant fine-tuned on user-shared conversations by LMSYSCode Llama: Open foundation models for code by MetaOpenChat 3.5: An open model fine-tuned on Mistral-7B using C-RLFT
DeepSeek LLM: An advanced language model by DeepSeekpplx-online-llms: Online LLM API by Perplexity AIOpenHermes-2.5-Mistral-7B: A mistral-based model fine-tuned on 1M GPT-4 outputs
Zephyr: A chatbot fine-tuned from Mistral by Hugging Face

DragGAN应用中心-OpenXLab

开源大模型DBRX1320亿参数,性能超LLaMA2、Grok-1!DBRX是一个专家混合模型(MoE)有1320亿参数,能生成文本/代码、数学推理等,有基础和微调两种模型。

根据DBRX在MMLU、HumanEval和 GSM8K公布的测试数据显示,不仅性能超过了LLaMA2-70B和马斯克最近开源的Grok-1,推理效率比LLaMA2-70B快2倍,总参数却只有Grok-1的三分之一,是一款功能强算力消耗低的大模型。

基础模型:https://huggingface.co/databricks/dbrx-base

微调模型:https://huggingface.co/databricks/dbrx-instruct

Github:https://github.com/databricks/dbrx

在线demo: DBRX Instruct - a Hugging Face Space by databricks

Samba CoE v0.2 (snova.ai)

GroqChat

随机文章