幻方量化公司旗下的开源大模型平台
DeepSeek(深度求索)是幻方量化公司旗下的开源大模型平台,成立于2023年7月,专注于研究世界领先的通用人工智能底层模型与技术,挑战人工智能前沿性难题。基于自研训练框架、自建智算集群和万卡算力等资源,DeepSeek(深度求索)团队仅用半年时间便已发布并开源多个百亿级参数大模型,如DeepSeek-LLM通用大语言模型、DeepSeek-Coder代码大模型,并且在2024年1月率先开源国内首个MoE大模型(DeepSeek-MoE),各大模型在公开评测榜单及真实样本外的泛化效果均有超越同级别模型的出色表现。
2024年5月6日,幻方量化在官微宣布,DeepSeek正式开源第二代MoE模型:DeepSeek-V2。
DeepSeek 旨在通过自然语言处理和机器学习算法来理解和回应用户的查询,DeepSeek 可以执行多种任务,包括但不限于:
在目前大模型主流榜单中,DeepSeek-V2 均表现出色:
✴️ 中文综合能力(AlignBench)开源模型中最强
DeepSeek-V2 与 GPT-4-Turbo,文心 4.0 等闭源模型在评测中处于同一梯队
✴️ 英文综合能力(MT-Bench)处于第一梯队
DeepSeek-V2英文综合能力(MT-Bench)与最强的开源模型 LLaMA3-70B 处于同一梯队,超过最强 MoE 开源模型Mixtral8x22B
✴️ 知识、数学、推理、编程等榜单结果位居前列
✴️ 开源模型,支持 128K 上下文,对话官网/API 支持 32K 上下文
DeepSeek推出的AI聊天产品通识对话可以在web端在线使用,访问DeepSeek官网,使用手机号注册登录后即可免费在线使用。
DeepSeek全系列已经完全开源,并且免费商用,可以进行私有化部署。
DeepSeek官方推出了移动端iOS、Android版DeepSeek App,可以去各大手机应用市场搜索“DeepSeek”进行下载使用。