船视宝主题赛道
第二十一届全国大学生交通运输科技大赛
赛题三

航数智算引擎

实现自然语言问题到 API 接口调用序列的精准转换,提升航运数据接口的调用效率和准确性

赛题背景

航数智算引擎

数字智慧赋能行业的转型是航运发展的新趋势,智能技术正在从概念验证走向规模应用。深化航运智能应用落地的过程中,对行业专业度和开发效率的要求持续升级。

本次挑战赛旨在通过分析用户意图、理解船视宝航运 API 作用,实现自然语言问题到 API 接口调用序列的精准转换。进而解决航运领域自然语言交互的实际痛点,提升航运数据接口的调用效率和准确性。

赛题任务

参赛者需利用提供的航运数据 API 建设 N2API 应用,在严格遵循任务要求的前提下实现核心任务。

任务要求

  • 应用若使用大语言模型需基于 Qwen3-8B 模型,允许对模型进行微调
  • 应用输出格式需严格遵循数据格式一节要求
  • 允许对接口进行二次封装以提升效果,但输出 API 序列必须是原接口名称和地址
  • 允许引入其他自研接口辅助效果提升,但输出 API 序列不得包含非赛题提供的接口名称和地址
  • 执行单个问题耗时不得超过 180 秒
  • 需要考虑追问的情况,即一组问题存在相互关联性和信息继承(一组问题会连续提问),记忆轮数应不少于 5 轮

追问示例:"Q1:中远意大利的 IMO 是啥? Q2:他现在在哪?Q3:什么时候到?"

核心任务

问题解析

解析航运领域的自然语言问题(如"中远意大利近三个月加了几次油?"、"查询港口代码是 CNQIN 的港口名称?")

API 分析梳理

理解航运 API 作用、输入/输出参数、调用约束等,梳理出调用组合和次序

智能识别

智能识别并区分追问问题和新问题

结果输出

按照数据格式要求,输出 API 调用序列数组(api_queue)、问题答案(answer)、关联问题(query)、问题 ID(query_id)

技术建议

鼓励参赛者灵活采用自然语言处理(NLP)、大模型微调、提示工程、意图识别、智能体编排、MCP、RAG、深度学习等技术,优化自然语言问题到 API 接口的转换精度,提升回答结果的准确性,重视 API 接口的调用约束以及模型幻觉等方面问题的处理。

数据说明

船视宝 API 接口文档数据集:本次赛事提供 API 说明资料详见附件《船视宝 API 接口文档数据集.zip》,涉及以下多个维度的接口:

船舶事故信息
船舶 PSC 信息
船期信息
基础信息
设备保养维修计划
船舶实时动态
实时位置
海洋气象
船舶未来风险
船舶历史风险
船舶运营统计
在船人员信息
船舶轨迹
港口 PSC 信息
港口动态信息
港口历史靠泊
港口流量指标
港口天气信息
港口基础信息
船舶/港口检索

注意

船视宝 API 接口需在 Header 中添加认证信息,该认证信息和添加方式在开赛后将通过官方渠道提供,请选择本赛题的参赛者届时联系相关负责人:谢老师,13916166925

应用结果评分标准

本次赛事采用客观量化评分方式,以参赛者输出的 API 接口调用序列数组(api_queue)与标准答案序列数组的匹配度、所有测试集的运行总时间为核心评分依据、参考问题答案(answer)的准确度为参考评分依据,具体规则如下:

1

本赛题采用加分制,每正确一题加一分。

2

每条题目的正确度以匹配参赛者提供应用输出的 API 调用序列与标准答案的匹配度为唯一依据(执行 3 次,每次会随机打乱问题顺序,但不会改变一组问题的先后顺序,最终参赛结果取 3 次中正确度的最低值)。需注意以下几点:

  • API 调用序列个数不正确,本题不得分
  • API调用序列中API名称(api_name)或API路径(api_url)不正确,本题不得分
  • API 调用序列中 API 的顺序不正确,本题不得分
3

若两位参赛者提供的应用依据规则 2 得分一致,按照执行完毕全部问题(包括执行失败的问题)的总耗时(执行 3 次,取平均值)对参赛者进行排序,耗时少者胜出。本规则仅统计到秒级,对小数点后耗时取四舍五入。

4

若以规则 3 仍旧无法区分参赛者次序,将参考输出问题答案的质量进行排序。

5

在线下比赛环节中,评委有权利依据输出答案质量进行适当加分(本规则不适用于初赛阶段)。

提交要求

参赛者需提交以下三类文件:方案文档、工程代码、模型文件(若有),所有文件需压缩为一个 ZIP 包,命名格式为「赛道名称_作品名称_作者名称_手机号.zip」

(注:该处手机号用于联系原作者以应对非正常情况导致的文件丢失,工程无法运行等意外情况,本赛事不会以任何方式泄露参赛者个人隐私信息)

1. 方案文档

方案中需包含以下条目:

  • 应用设计思路(必须)
  • 应用使用技术说明(必须)
  • 应用执行原理(必须)
  • 工程启动/复现说明(必须)
  • 模型训练与评估过程(如果进行模型精调)(可选)
  • 异常处理方案(可选)
  • 自评估方案及结果(可选)

2. 代码工程文件

  • 完整可运行的代码(必须)
  • 代码需添加详细注释,确保可复现性(必须)
  • 代码运行说明文档(README.md),明确运行步骤、环境要求、参数配置等相关说明(必须)

3. 训练后的模型文件

基于 Qwen3-8B 微调/训练后的模型权重文件及配置文件,例如:

模型文件名称(示例)
.gitattributes
config.json
configuration.json
generation_config.json
LICENSE
merges.txt
model-00001-of-00005.safetensors
model-00002-of-00005.safetensors
model-00003-of-00005.safetensors
model-00004-of-00005.safetensors
model-00005-of-00005.safetensors
model.safetensors.index.json
README.md
tokenizer.json
tokenizer_config.json
vocab.json

注意:如果进行了模型微调必须提供该套文件,以保证应用复现。

数据格式

1. 输入数据格式

{
  "query_id": "这里是问题 ID",
  "query": "中远海运荷花的当前船期信息是什么?"
}

2. 输出数据格式(需严格遵循)

{
  "query_id": "这里是问题 ID",
  "query": "中远海运荷花的当前船期信息是什么?",
  "api_queue": [
    {
      "api_name": "按船名 MMSI 等信息模糊检索船舶",
      "api_url": "https://svc.data.myvessel.cn/sdc/v1/ai/vessel/fuzzy"
    },
    {
      "api_name": "按 MMSI 查询船舶当前船期信息",
      "api_url": "https://svc.data.myvessel.cn/sdc/v1/ai/vessel/schedule/current"
    }
  ],
  "answer": "这里是问题答案。"
}

赛题资料