7月24日,数据猿在北京举行“2024企业数智化转型升级发展论坛——暨AI大模型趋势论坛”,论坛上公布了《2024中国数智产业AI大模型先锋企业》榜单,达观数据凭借在大模型领域的出色能力获此殊荣,入选榜单。
该榜单由数据猿携手上海大数据联盟共同推出,历经数月,由数据猿组建的初审小组、核心粉丝组成的公审团,以及外部行业专家成员组成的终审团,通过直接申报交流、访谈调研、外界咨询评价、匿名访问等交叉验证的层层筛选推荐机制下,最终评选发布。此次入选,是对达观垂直大语言模型能力的再次肯定。
达观数据的垂直大模型是一款国产大型语言模型,专为垂直领域定制。通过并联多种模型,支持专业文档写作、知识检索、知识问答、文档审核等场景。拥有高质量行业数据混合增量预训练构建强大垂域基座,拥有文档审阅、知识增强检索、专业写作、资讯解读、对话分析5大类100+细分场景沉淀指令数据,通过通用指令、NLP指令、垂直领域指令微调激活大模型专业场景应用处理能力,成为更懂实际业务的大模型。目前已通过国家网信办第三批生成式人工智能服务备案。
达观垂直大模型是“混合模型+垂直知识+场景应用”,它兼容了多种基座模型,不仅有自有的“曹植”大模型以及第三方基座模型如百川、智谱、Llama等,方便兼容并包、实用性强。”曹植”大模型以其在长文本处理领域的专业能力而闻名。同时,它还积累了丰富的高质量行业数据,通过混合专家系统和垂直精调训练(SFT),让大模型更懂业务,赋能更多专业场景来量身打造专业报告写作、行业规则下的文档审阅、专业Agent助手和行业属性强相关的智能应用产品。达观数据坚持自主可控的训练数据和算法模型,与国产GPU实现联调对接,提供”算力+模型”的全套国产化信创方案,赋能百业,推动行业创新与发展。
未来,达观数据将在垂直大模型领域继续探索,推动人工智能技术的革新与实际应用,促进跨行业的知识共享和技术融合,为解决行业特定问题提供更为精准和高效的解决方案,拓展垂直大模型的应用范围,助力社会向更高层次的智能化和自动化发展。