| 成交供应商: | 北京荣达信通科技有限公司 |
| 质疑投诉说明: | 如对公示结果有异议,请在公示发出后一个工作日内将书面质疑信息提交至中国政法大学招投标及采购管理办公室。 |
| 项目名称 | 中国政法大学算力及大模型管理服务采购项目 | 项目编号 | CUPL2025FSC068 |
| 项目编号 | CUPL2025FSC068 | ||
| 公告时间 | 2025/12/15 08:25 | 报价截止时间 | 2025/12/18 08:25 |
| 报价截止时间 | 2025/12/18 08:25 | ||
| 踏勘联系人 | 踏勘联系电话 | ||
| 踏勘联系电话 | |||
| 踏勘地点 | |||
| 采购单位 | 中国政法大学 | ||
| 联系人 | 成交后在我参与的项目中查看 | 联系手机 | 成交后在我参与的项目中查看 |
| 联系手机 | 成交后在我参与的项目中查看 | ||
| 是否本地化服务 | 否 | 是否需要踏勘 | 否 |
| 是否需要踏勘 | 否 | ||
| 采购预算 | ¥99,000.00 | 成交金额 | ¥85,000.00 |
| 成交金额 | ¥85,000.00 | ||
| 采购内容 | 是否限定品牌型号 | ||
| 算力及大模型管理服务 | 否 | ||
| 采购数量 | 1 | ||
| 预算总价(元) | 99000 | ||
| 售后服务及质保期 | 合同签订生效后提供12个月算力及大模型管理服务,在服务期限内,及时响应和应对出现的相关问题,电话技术支持响应时间不大于15分钟,技术人员到位时间不大于两小时,一般问题在24小时之内解决,如遇重大问题在72小时内解决。 | ||
| 技术参数要求 | GPU集群管理 1)OS与架构:支持RedHat/Ubuntu/OpenEuler等主流Linux及x86/ARM架构。2)异构硬件:统一纳管NVIDIA/AMD/昇腾/海光/寒武纪/燧原/天数/摩尔/沐曦等主流GPU,支持混合部署。3)集群池化:支持Docker/K8s/公有云主机等方式组建纳管多物理/逻辑集群。 模型访问及下载 1)仓库集成:图形化集成HuggingFace/ModelScope,支持在线搜索。2)下载管理:支持不占GPU在线下载及本地模型注册纳管。 模型部署及管理 1)多模态:原生支持LLM/VLM/Embedding/Rerank/TTS/STT/视频及OCR等自定义引擎。2)多引擎:内置vLLM/SGLang/MindIE及国产卡适配版,支持容器化接入自定义引擎。3)多版本:解耦引擎与平台,支持多版本按需选择/下载/切换。4)分布式:支持张量/流水线并行及多机多卡自动调度。5)调度策略:提供Binpack/Spread智能调度及标签/指定GPU手动调度,支持共享GPU。6)高可用:支持多实例负载均衡、故障自愈及跨节点迁移。7)兼容性:图形化检测模型/OS/资源依赖。8)公有云:集成千问/DeepSeek等服务及鉴权。 性能优化 1)生成加速:支持N-gram/Eagle/MTP算法及草稿模型配置,降低延迟。2)扩展KV缓存:一键启用LMCache/HiCache优化长文本。3)预置模式:提供延迟/吞吐量/标准优先模式,支持参数自定义。 调测管理 1)交互测试:图形化调整参数(Temp/Top P)实时查看输出。2)对比测试:支持同输入下多模型并行对比。3)全类型支持:覆盖对话/图像/语音等全模态测试。4)代码生成:自动生成CURL/Python/Node.js代码。 用户及用量 1)RBAC:支持Admin/User角色及精细权限控制。2)访问控制:支持用户/组的模型白名单授权。3)度量配额:统计Token用量与资源趋势,支持设限管控成本。 可观测性 1)服务监控:采集vLLM等引擎延迟/吞吐/队列/KV缓存指标。2)资源监控:实时监控节点CPU/内存/GPU负载/显存/温度。3)统一接口:提供归一化指标,支持Prometheus/Grafana集成及预置面板。 接口与集成 1)管理API:提供OpenAPI/Swagger支持自动化运维。2)推理API:兼容OpenAI/Jina协议,对接LangChain/Dify/RAGFlow。3)SSO:支持OIDC/SAML对接企业认证。 | ||