全球首个!中国发布多模态地理科学大模型“坤元”

发布时间:2024-12-15 21:09:46 来源: sp20241215

中新网 北京9月19日电 (记者 孙自法)由中国科研团队成功研发的全球首个多模态地理科学大模型“坤元”(Sigma Geography),9月19日在北京正式面向全球发布。作为一款专注于地理科学的专业语言大模型,“坤元”具备处理地理科学相关问题的专业能力,堪称“智能地理学家”,致力于推动地理学与人工智能深度融合。

有何特点?

中国科学院地理科学与资源研究所(地理资源所)当天举行专题新闻发布会介绍说,“坤元”大模型由该所联合中国科学院青藏高原研究所、中国科学院自动化研究所共同研发,通过地理学全谱系高质量语料库构建、地理科学语言大模型构建、地理科学研究智导平台研发等工作,让“坤元”具备“懂地理”“精配图”“知人心”“智生图”等特点,实现地理专业问题解答、地理学文献智能分析、地理数据资源查询、地理数据挖掘分析、专题地图绘制等功能。

9月19日,“坤元”大模型研发组首席科学家、中国科学院地理资源所副所长苏奋振研究员介绍“坤元”大模型特点并回答媒体提问。 中新网 记者 孙自法 摄

“坤元”大模型研发组首席科学家、中国科学院地理资源所副所长苏奋振研究员指出,“懂地理”方面,研发团队建立涵盖4大类、16小类的地理全学科语料库,提供320亿词元供大模型自监督学习,并制作出4万余条高质量地理学指令进行模型微调。相比通用语言大模型,“坤元”更熟悉地理学的语言模式、专业术语和领域知识,在地理学基准测试集上的准确性提升了31.3%。

“精配图”方面,自主研发出面向多层次地图信息的多模态检索技术、支持地理认知与图形表达的知识推理技术,使得“坤元”能够在解答地理学提问的同时,可根据生成的文字答案检索不同地理要素,并匹配地理景观照片、专题地图或示意图表呈现给提问者。

“知人心”方面,创新提出基于“认知启航—应用智导—前沿研析”框架的用户画像精准判别与响应技术,保证“坤元”能够充分考虑地理知识爱好者、地理学专业学生以及科研人员的地理科学知识体系认知和表达差异,以图文共现的方式给出适配用户知识结构的地理学专业问题解答。

“智生图”方面,基于“坤元”开发的科研助手,可根据用户指令完成概念理解、数据获取、信息分析、制图综合等流程,最终生成用户需要的专业地理图表。

如何评价?

“坤元”大模型研发组科学顾问、中国科学院院士周成虎表示,地理科学大模型“坤元”将更好地帮助人们认知世界、重塑人们对世界的认知体系。作为地理科学大模型的起步,他希望在当天发布的“坤元”大模型基础上,积聚全球地理科学数据,融汇全人类的地理科学知识,构建能够服务于人类可持续发展的新的科学体系,进而推动地理科学进一步发展。

9月19日,“坤元”大模型研发组科学顾问、中国科学院院士周成虎在发布会上致辞。 中新网 记者 孙自法 摄

中国科学院地理资源所所长孙福宝研究员指出,研发全球首个地理科学大模型“坤元”,能够实现包括地带性、区域性等的专业性的智能分析,体现出该所在地理与资源领域的科技实力,有助于推动地理科学向地理智能的跨越,革新地理科学研究范式,抢占国际地理智能制高点。

中国测绘科学研究院副院长刘纪平研究员认为,“坤元”大模型项目体现出中国地理信息领域的前沿创新能力,其研发成果不仅在学术上具有重要意义,还为地理科学与测绘领域的智能化发展提供了强有力的技术支撑。这一成果的广泛应用,将极大推动测绘行业的进步,为中国地理科学的全球竞争力提升做出重要贡献。

北京大学刘瑜教授指出,“坤元”大模型体现了对不同群体的定制化服务能力,这也为未来地理科研教育工作中的智能化和个性化服务提供了范本。未来通过地图大模型与地理推理机的研发,预计能够进一步提升地理信息处理的智能化水平,为地理科研协作提供全新的范式。

百度公司主任架构师张刚说,“坤元”具有专注领域的模型构建、多模态技术的应用、用户画像与精准响应等重要亮点。通过模型、数据和研究思路的共享,“坤元”有望成为地理科学领域的研究者之间的重要协作工具。

何为目标?

中国研发并发布的全球首个多模态地理科学大模型为何取名“坤元”?苏奋振解释说,源自“乾坤”的“坤”即大地;“元”是起始,又是“神经元”,所以,“坤元”就是指关于大地的神经元系统,大地的智能,也就是地理科学的智能。

“坤元”大模型旨在拓宽普通大众的地理视野,解放地理从业者的双手,推动地理智能发展,赋能地理科学研究、加速重大地理科学发现。目前,“坤元”大模型项目已在《自然》系列、《创新》《地球的未来》等学术期刊上支撑发表高水平学术论文10余篇。

苏奋振表示,下一步,“坤元”研发团队将推进地图大模型及地理推理机研发,有望让地理科学语言大模型读懂地图;将打造地理科研协作大平台,以期让每个科学家和科研团队都可以拥有专属的地理大模型,能够与数百万科学家通过共享数据、模型、研究思路等方式协同工作。

他透露,地理科学大模型未来建设规划将分地理语言大模型、地理识图大模型、地理专业智能体“三步走”,最新发布的“坤元”大模型只是第一步,研发团队后续还将在区域模型智能演进技术的基础上,通过突破地图智能认知技术、多模态耦合交互技术,实现地理科学大模型由现阶段的“地理学家”发展成为“地图学家”“地理智能科学家”的目标。(完)

【编辑:姜媛媛】