专注工科类创新实验教学、科研开发20余年!方案覆盖嵌入式、IOT、AI、机器人、集成电路、新能源等领域。
 
  当前位置:首页 >> 新闻动态 >> 产品资讯
 
公司新闻
 
培训与竞赛
 
行业新闻
产品资讯

 
数字人与智慧问答实验/实训室建设方案
     革新科技  来源:不详 日期:2025/2/14 16:45:52 阅读:233 次
- 返回 -
 
一、建设目标
面向《“十四五”规划纲要和2035年远景目标纲要》发展和人才战略需求,以全面服务推进学校建设“特色鲜明、有国际影响的一流大学”为总牵引,以推进学校科技创新体系建设为核心,聚焦AI领域面临的重大理论和现实问题,致力于用AI赋能学科建设和新质生产力人才孵化,更有力地服务新型技术专业领域的学科建设研究、市场经济社会发展,提升服务社会能力,夯实创新产业人才服务基础。
通过本项目建设与实施,提升学校人工智能通识教育水平、学校教师的人工智能素养,为学校优势学科及特色学科集群的实践教学、课程建设提供基础设施,以国家高等教育数字化转型发展目标、项目为引领,紧抓引进、培养、稳定三个环节,坚持数量与质量相结合,分类指导、整体推进,建设一支团队结构合理、一流国际水平、研究方向稳定、潜心教书育人、有仁爱之心的优秀师资队伍。深化科教融合架构,发展创新领军人才培养模式。面向人文专业学科的创新人才需求,深度挖掘AI技术与相关教学和实践的人才培养需求,充分利用相关技术、企业等资源的力量,建设适合本校特色专业与未来技术结合的创新教学实验室,以大团队、大平台、大项目支撑高质量创新人才培养,做好未来科技创新领军人才的前瞻性和战略性培养。

二、建设意义
2.1 需求现状
随着数字技术的飞速发展,尤其是人工智能、大数据、云计算等前沿科技的不断进步,AI作为快速发展并影响力广泛的新型技术,在教育、服务业、传媒娱乐等多个领域显示出巨大的应用潜力。建设一个专门的AIGC实验室,不仅可以提升我校在数字技术教育领域的竞争力,也能为学生提供前沿技术的实践平台,增强其未来就业与创新能力。本报告将分析AIGC实验室的可行性,探讨其必要性、成本、预期效益及实施计划。
AI技术涉及多学科知识的集成,包括但不限于计算机科学、人工智能、图像处理、语音识别等。当前,该技术已经被广泛应用在游戏、影视、出版、金融、数字人等多个领域。随着技术的成熟和应用需求的增加,培养掌握此技术的人才变得尤为重要。
据不完全统计,2023年全球AIGC产业融资超1900亿元。2023年中国AIGC市场规模约为170亿元,预计2025年之前,中国AIGC市场规模增长率都将维持在25%左右,2025年市场规模将达到257亿元。2025年起,随着底层大模型逐步对外开放,中间层及应用层将迎来爆发式增长,带动AIGC行业市场规模快速增长,年均复合增长率将超过70%,到2027年,中国AIGC市场规模将超过600亿元。2028年起,AIGC产业生态更加成熟,并在各行各业实现商业化落地应用,2030年,市场规模将超过万亿人民币。
2024年4月17日,人力资源社会保障部等九部门发布《加快数字人才培育支撑数字经济发展行动方案(2024—2026年)》,旨在发挥数字人才支撑数字经济的基础性作用,为高质量发展赋能蓄力。《方案》指出,用3年左右时间,扎实开展数字人才育、引、留、用等专项行动,提升数字人才自主创新能力,激发数字人才创新创业活力,增加数字人才有效供给,形成数字人才集聚效应,着力打造一支规模壮大、素质优良、结构优化、分布合理的高水平数字人才队伍,更好支撑数字经济高质量发展。

2.2 项目必要性
■应对市场行业、岗位技术的快速革新
AI技术的快速发展,对未来岗位的技能要求发生了完全的革新变化,内容的创作者从人逐渐转变为了AI,但不变的是AI仍旧是人类的工具产物,学会驾驭AI工具,与AI共存成为未来各岗位人才无法绕开的问题。借助于AI快速生产能力辅助,能大大优化生产效率,掌握相关技术对高校人才培养来说已迫在眉睫。
■培养学生跨学科综合技能
基于AI技术的跨学科特性,在实验室的实践型教学中自然的锻炼学生实践操作运用的同时,覆盖到计算机图形、图像识别、内容策划创意、交互制作等综合性能力的培养,形成项目化培养模式,锻炼创意创新思维。
■ 推动AI相关技术学术研究及课程和学科建设研究
在学生实践教学中,引入横向研究项目,由老师带领学生团队共同进行研学研创,探索教育理论实践和技术研究的推进。也可通过与相关机构、企业的合作项目引入,赋能技术研究的不断提升优化,提升综合教学质量,提升师资队伍能力,提升人才培养的服务创收能力等。
■促进交叉融合,抢占未来制高点
面向世界科技前沿、面向经济主战场、面向国家重大需求、面向人民生命健康,有利于学校整合多学科力量,聚焦“立校为公、执教报国”,推进学科交叉融合和创新发展,打造特色鲜明、优势突出、相互支撑、协同发展的世界一流学科。以学科交叉为牵引,组建交叉团队,建设交叉平台,培育复合人才,承接重大项目,产生重大成果,为国家发展和社会进步作出交大贡献。
■社会影响和责任
AI技术快速发展同时伴随着伦理和责任问题的争议,该实验室的建设和教学课程内容将为学生提供构建正向、安全、负责人的职业技术素养教育,加强思政课程的结合引导学生正取认知技术、应用技术,为社会做出积极贡献。
通过掌握AI技术在专业领域的应用,学生将能够创建出具有广泛社会影响的作品。这不仅有助于他们个人的职业发展,也将提升学校和社会的影响力。

2.3 预期建设成效
坚持以习近平新时代中国特色社会主义思想为指导,学习贯彻习近平总书记关于教育、科技工作的重要论述和来校考察重要讲话精神,落实“四个面向”,深化创新港内涵建设,创新大学与经济社会统筹融合模式,为新时代高等教育高质量发展提供新路径。
深化大学与经济社会融合新模式:构建起产教融合、协同创新新体系,通过人才发展机制创新、关键共性技术攻坚、加快科技成果转化、创新资源共享等,实现与社会的深度融合,为新时代高等教育高质量发展探索新路径,为现代大学与经济社会统筹融合提供新模式。
打造校企协同新型育人平台:以学校产业资源为依托,形成校企合作协同育人新范式,汇聚一支具有精湛学术水平、谙熟产业前沿的卓越师资队伍以及一批高水平的企业合作导师,建立校企合作、项目驱动、知行结合、协同育人的生态体系,培养引领未来技术的创新领军人才和卓越工程科技领军人才。
打造高端人才汇聚“智高点”:建设一支德才兼备、学术精湛、全球视野、国际水平的教学科研队伍,师资规模、队伍结构、精神气质、产出贡献符合世界一流大学水平,打造江苏省高端人才汇聚的“智高点”,为国家经济建设、科技进步和社会发展提供人才库、知识库、思想库和成果库。
打造人工智能课程教学模式示范项目:深化AI与课程实践教学的结合,融入到实践教学内容的设计、教师教学手法、教学实践过程、学生项目产出物等方方面面。并且以完整完善的项目课题形式,融合多元的教学和产出评价目标,进行润物细无声的教学影响力打造,引领推动周边及区域内的人工智能课程建设能力。

三、项目绩效产出
3.1 产出1个校内教师使用的AI录课平台,有效解决录课低效问题,对教师一次录制后,将教师形象数字化永久使用,教师仅需提供录课PPT即可进行课程视频制作。
  在学校机房部署高性能服务器进行形象和音色的统一渲染合成,部署帐号管理平台对用户的数字形象和音色进行管理,形象均保存在本地,防止形象泄漏风险。为教师分配平台帐号,教师可以通过任何一台与校内局域网连接的电脑拿自己的数字分身进行课程的快速制作,大大方便了老师的录课操作。

3.2 产出1门人工智能方向的《数字人的制作与应用》课程,共32学时,理论和实践各16课时,2学分制,面向全校学生选修。
教学模式创新的采用以下方式:
(1)理论与实践相结合,重视培养同学的动手能力和解决实际问题的能力,确保每位学生能够在实验室环境中亲手操作和进行实践。
(2)高校与企业相结合。本课程将引入人工智能头部企业,校企合作进行教学,整合双方优势资源,部分课时由具有丰富项目经验的企业工程师进行教授,丰富教学内容,使同学能够了解最新的科技发展和行业动态,从而提升教学质量和科研能力。
(3)教学与科研相结合。将搭建教学与科研相结合的机制,定期向学生介绍本课程的前沿研究和学院教师的科研项目,激发学生的兴趣,鼓励学生参与教师的科研项目,或者自主开展研究性学习,通过科研活动提升学生的创新能力和解决复杂问题的能力。
(4)跨学科相融合。
打造不同专业同学共同学习的开放课堂,通过与来自不同专业背景、学术领域和地域文化的同学互相交流,同学们能够接触到更多元化的观点和视角,拓宽学术视野,激发学习动力,促进跨学科知识的融合与创新,为培养全面发展的高素质人才提供有力支持。    

3.3 产出1个数字人AIGC实验室,一个专门为数字人的设计、制作和应用开发而设立的实验室,保证课程的实践部分顺利开展。
    它结合了最先进的计算机图形技术、人工智能算法和多模态交互技术,致力于创造高度逼真的数字人物模型和交互体验。数字人AIGC实验室是艺术与科技交融的展示场,提供从概念设计到产品实现的全链条服务,通过与行业领先的技术合作伙伴合作,不断探索数字人技术的新可能性。它将承担学生实验实践,直观的了解从真实的人怎么一步步将形象数字化,让每位学习过的学生都能拥有自己的数字分身,同时将数字分身应用于短视频制作,直播和交互等。

3.4 产出1个基于大模型的智能问答平台,将校内一些行政制度的文档上传到知识库,学生以对话框问答的方式来了解一些规章制度。
    在学校机房部署高性能服务器进行智能问答平台的部署,根据学校需求可以接入云端大模型,也可以接入离线开源模型,管理员可以在平台上自由分配帐号,给用户独自的空间和权限来设置自己的知识库及应用,同时将应用分享给需要访问问答平台的人,以快速的了解想知道的内容。
通过上述课程建设和关键技术探索平台建设,最终形成集人才培养、学科建设、科研创新、产业应用于一体的具有国际领先水平的多维多尺度跨模态一体创新平台,可为AI在课程、教学、行政等领域的技术应用实践和创新实践提供可借鉴的探索路径和经验总结。

四、建设方案
4.1 基于数字人的AI精品视频课生成及账号登录、管理、应用平台建设
4.1.1 AI录课平台AiClassroom
Ai录课平台是一款针对教师微课录制的新型一站式合成平台。它集合了形象和音色训练工具、课程合成工具、用户认证管理工具、形象与音色合成工具等。
主要产品
(1)课程合成软件imageCreator-2D
以自研渲染引擎为基础,集PPT导入、教师数字分身、音色克隆、素材、字幕合成于一体,将AI技术与虚拟数字人完美结合,全新定义微课录制的流程,无需专业视频制作人员,通过简单拖拽即可在几分钟内制作出精美的微课视频。
主要功能:
■虚拟数字人导入:产品支持人物形象定制导入,还原度不低于99%。产品支持真人音色克隆调用,还原真人音色,语气。
■支持不限量添加叠层素材:软件支持画面中添加多种不同素材,可自由切换调整其层级,大小,缩放等属性,并支持直接在画面上进行拖拽操作,更简单地添加丰富的视频效果。
■支持素材自由导入:软件支持从本地进行素材导入,自定义视频图片、语音、字幕、音乐、画中画视频等素材。让创作更加自由。
■支持多场景实时切换:软件可无上限添加不同的场景或镜头,并根据文稿内容实现不同镜头的实时切换。
■支持ppt一键转视频:软件支持将ppt直接导入,结合虚拟数字人一键快速生产视频。
■支持自动生成字幕:软件支持根据文稿内容AI智能合成字幕,并有丰富的属性可调节,字体、大小、位置、描边、投影等一应俱全
■支持上百种AI音色配音:软件提供上百种不同类型的AI配音音色可进行选择,支持调整语速音量停顿等,变化。
■满足不同平台视频压缩格式需求:产品导出的视频支持选择多种视频格式、码率、帧率参数(支持 MP4、MOV 、TS和 MXF 格式, 支持 MPEG-2、MPEG-4 和H.264 、H.265等编码方式以及 1Mbps 到 100Mbps 可调的码率)。

(2)形象及音色训练平台-imageClone分影
imageClone分影软件是一款前沿的数字分身制作工具,它运用尖端的人工智能技术,能够克隆个人的外观与声音,创建高度逼真的数字化人物。通过先进的深度学习算法和自然语言处理能力,分影不仅捕捉用户的面部表情和动作,还能模拟其语音特征,音色语气,实现与真实人物极为接近的数字体验。这一创新技术为不仅为用户带来了全新的互动方式,可以广泛应用于娱乐、教育、在线服务和企业宣传等领域。而且随着数字化转型的不断深入,各企业将以分影数字分身技术为基础,跨越传统界限,将数字化人物带入各种创新融合的新境界。
主要功能:
■imageClone分影是一款充满无限可能性的数字创作崭新世界。将真人训练视频注入imageClone分影,结合强大的AI技术,创造出惟妙惟肖的虚拟数字分身。imageClone分影旨在为您的品牌、企业或个人形象赋予独特的意义,成为数字化品牌的引领者和开拓者,分影的主要功能有:
■人物训练素材上传:分影平台支持导入并上传MP4,MOV等常用视频类型的训练素材,并根据音频波纹自动切分,将训练素材逐句拆分为多个视频。
■素材自动预处理:分影平台支持将切分后的素材自动转码及重采样,预处理为符合训练需求的视频素材。
■人物面部定位及特征识别:分影平台支持自动定位训练素材中的人物头部位置,根据视频生成带有人脸坐标的csv文件。同时将逐帧提取人物面部特征并进行保存。
■AI神经训练:分影平台支持将训练素材中人物声音和面部及唇形特征进行匹配,之后通过AI算法进行深度学习,输出庞大的训练模型以供选择。
■AI音色复刻:分影平台支持将人物的声音提取并自动根据音韵进行标定,之后通过AI音色克隆算法进行深度学习,输出与真人音色一致的tts模型。
■AI模型导出:分影训练出的AI模型可以导入到iMageCreator创影,imageKnow元智等虚拟人产品中进行应用。

产品优势:
■超低成本数字分身定制:拥有分影之后即可无限制进行虚拟数字分身克隆,再也没有使用时长限制,人物数量显示,服装形象限制。
■超简单一站式制作体验:分影将复杂的算法命令全部整合并可视化,用户只需要按要求上传对应的训练素材,通过简单点击即可完成训练,界面简单明了,无需专业人员培训,十分钟即可上手操作
■超快效率分身制作:imageClone分影从素材上传到模型输出,最快24小时即可投入使用。
■超写实虚拟数字分身:imageClone分影使用行业领先AI神经训练算法,创建出的虚拟分身与真人相似度可达99%,姿态自然,动作流畅。
■超高度还原音色:imageLive分影使用自研语音大模型算法,提供高品质复刻能力,高度还原真人的音色特点,说话风格,口音效果。
■多场景无阻力应用:imageLive分影创建出的数字分身,可以在相关生态内无阻力随意调用,无需二次开发,可直接用于直播,短视频输出,交互数字人等多种数字人产品。

(3)形象及音色合成平台-imageMake如影
imageMake如影是一个进行数字形象和音色合成的平台,对训练好的数字形象和音色模型根据用户输入的文字或者音频进行推理,制作出与真人无异的虚拟数字分身视频。
主要功能:
■数字形象合成:用户可以根据通过输入文案或者音频,选择或定制数字形象,包括外观、服装和表情,进行数字形象的推理合成。
■音色合成:输入文案,根据用户的选择,合成不同风格和音色的语音,包括用户自己的声音。
■音频到视频同步:用户上传音频文件,平台能通过合成技术,将数字形象的口型与音频同步。
■高度真实性:合成结果力求达到与真人无异的效果,不仅在视觉上,也在声音上尽可能地自然和真实。
■多场景适应性:可以用于不同的场景和用途,如虚拟主播、教育培训、远程会议等。

(4)帐号管理平台- imageManager影控平台
imageManager影控平台是一个本地端的帐号管理平台,它除了可以进行帐号的增删改查外,还可以对帐号的权限资源进行控制,也可以对帐号进行父子级绑定,满足组织对用户帐号的管理需求。
■账号增删改查:
   - 创建新用户账号。
   - 删除不再需要的账号。
   - 修改现有账号的信息。
   - 查看账号列表和账号详细信息。
■权限资源控制:
   - 分配不同的访问和操作权限给不同的账号。
   - 管理账号能够访问的数据资源范围。
   - 更新和调整账号权限设置。
   - 确保每个账号只能访问授权的资源。
■账号层级绑定:
   - 建立账号之间的父子关系。
   - 父账号能够管理子账号的权限和资源。
   - 实现组织结构中的层级管理和控制。
■组织管理需求满足:
   - 支持复杂的组织架构和多级部门管理。
   - 提供组织内部账号管理的整体解决方案。
   - 自定义组织内账号的结构和管理流程。
■用户界面友好:
   - 提供清晰的用户界面,以便管理人员容易理解和操作。
   - 功能分类明确,易于找到和执行特定操作。
■安全性保障:
   - 保护账号信息和权限设置的安全。
   - 防止未授权访问和操作。
   - 可能包括多因素身份验证和加密措施。
■集成和兼容性:
   - 与现有的IT基础设施和其他管理工具集成。
   - 支持不同操作系统和数据库。
■扩展性和可配置性:
   - 能够随着组织的发展进行扩展。
   - 允许定制配置以适应特定的管理需求。


4.2 人工智能数字人课程建设 
本课程是为全校开设的一门选修课,目的是让学生学会如何制作自己的数字分身。本课程通过教学与实践,使学生在深入学习AI相关的知识,直观的了解数字人是如何制作的,同时掌握数字人的多种应用,并通过一系列的实践来增强实战能力。
4.2.1 教学目标
1.思想、素质教育目标
目标1.1  培养学勇于创新,开拓新领域的精神
目标1.2  培养学生法律环境保护意识和全面的职业道德素养;
2.知识教学目标
目标2.1  了解元宇宙及虚拟数字人技术理论知识;
目标2.2  了解元宇宙及虚拟数字人发展与未来发展趋势;
目标2.3  初步掌握虚拟数字人制作流程;
目标2.4  掌握数字人合成工具的使用;
3.能力教学目标
目标3.1  初步具备虚拟人制作能力,完成自己的数字分身制作;
目标3.2  初步具备对多种素材的采集汇聚、分析处理的能力;
目标3.3  初步具备与数字人合成工具功能结合,解决行业应用需求能力;

4.2.2 课程的教学内容和要求
1.教学要求
(1)深入探索二维和三维数字人制作的工作流
(2)全面掌握数字人的相关技术及相关软件的使用。
(3)结合实战,掌握一个完整数字人诞生及使用的全流程。
2.教学内容
单元知识点1:什么是元宇宙(2课时)
(1)知识点1:概念及发展历史
(2)知识点2:元宇宙六大底层技术:区块链技术(Blockchain)、交互技术(Interactivity)、电子游戏相关技术(Game)、人工智能(AI)、网络及运算技术(Network)、物联网技术(Internet of Things)。
(3)知识点3:相关领域产业应用
(4)知识点4:元宇宙未来理想形态:了解元宇宙虚拟现实行业现状;了解元宇宙技术涵盖领域;了解元宇宙的基本概念及发展历史;了解元宇宙未来发展形态。
单元知识点2:什么是数字人(2课时)
(1)知识点1:数字人概念及分类
(2)知识点2:数字人产业链及应用:产业链上游、产业链中游、产业链下游
(3)知识点3:数字人价值和意义
(4)知识点4:数字人的发展与未来:了解虚拟数字人基本概念及分类;了解数字人现实产业现状;了解虚拟数字人的意义和价值,了解虚拟数字人未来发展方向。
单元知识点3:二维数字人的制作(20课时)
(1)知识点1:制作原理:当前二维数字人技术介绍、Wav2lip介绍
(2)知识点2:技术架构:唇形驱动模块、面部生成模块、图像处理模块
(3)知识点3:训练视频录制:录制环境、录制设备、录制要求
(4)知识点4:训练前工具准备及数据处理:训练环境部署、训练数据的处理、训练启动步骤、训练模型导出、训练模型测试
(5)知识点5:人物模型测试:掌握二维虚拟数字人制作的整体工作流程,;学生动手实践制作自己的二维虚拟数字人分身。

单元知识点4:三维虚拟人制作(18课时)
(1)知识点1:制作原理:模型制作流程、人物驱动方式
(2)知识点2:技术架构:人物形象模块、语音生成模块、动画生成模块
(3)知识点3:角色设计:设计角色世界观、设计人物风格和原画、角色的六要素
(4)知识点4:骨骼绑定
(5)知识点5:动作设计:了解三维建模的基础知识,掌握三维虚拟人制作到驱动的工作流程,尝试自己制作三维虚拟人
单元知识点5:数字人快速合成平台(8课时)
(1)知识点1:平台界面布局介绍
(2)知识点2:场景素材导入
(3)知识点3:虚拟人导入
(4)知识点4:镜头脚本制作
(5)知识点5:视频渲染导出:掌握数字人合成工具,利用自己制作的数字人进行驱动并进行视频合成。
单元知识点6:数字人的行业应用(4课时)
(1)知识点1:媒体宣传
(2)知识点2:教育培训
(3)知识点3:医学科普
(4)知识点4:反诈宣传
(5)知识点5:直播带货:了解目前数字人行业应用案例,学生通过自己制作的数字人应用到实际场景中

4.2.3 实践(实验)教学环节(含实验项目、实践内容)
1.尝试以自己形象制作自己的二维和三维数字分身。
2.尝试以自己制作的数字分身合成不同应用场景的数字人应用。


4.3 基于数字人方向的实训平台
实验室不仅是知识的传授场所,更是激发创造力、探索未知领域的舞台,为学生开启通向数字未来的大门,此次方案将虚拟数字人的制作、验证及体验相结合。我们提供数字人训练平台实现现实人物的形象和音色复刻,将数字形象应用于短视频制作平台、人机交互平台及直播平台,学生可以自己动手,实现一个数字人物,然后结合自己的专业进行相关应用,投入到实际的应用场景中,体验虚拟数字人从制作到落地的工作流程。激发学生们的创新性,让学生在模拟的虚拟环境中进行学习和实践,提升他们的动手能力和问题解决能力。

4.3.1 数字人训练平台——imageClone分影
imageClone分影,充满无限可能性的数字创作崭新世界。将真人训练视频注入imageClone分影,结合强大的AI技术,创造出惟妙惟肖的虚拟数字分身。通过先进的推理模型,您将在短时间内制作出个性鲜明的数字分身,为您的形象赋予独特的意义,成为数字化形象的引领者。
主要功能:
■导入人物形象训练素材:
平台支持导入并上传MP4,MOV等常用视频类型的训练素材,并根据音频波纹自动切分。
■训练素材自动预处理:
平台支持将切分后的素材自动转码及重采样,预处理为符合训练需求的视频素材。
■人物面部特征识别:
平台支持自动提取训练素材中的人物面部特征识别及提取,根据视频生成带有人脸坐标的csv文件
■AI神经训练:
平台支持将训练素材中人物声音和面部及唇形特征进行匹配,之后通过AI算法进行深度学习,输出庞大的训练模型以供选择。
■AI音色克隆:
平台支持将人物的声音提取并自动根据音韵进行标定,之后通过AI音色克隆算法进行深度学习,输出与真人音色一致的tts模型。
■模型调用:
imageClone分影训练出的AI模型可以导入到创影,元智等虚拟人产品中进行应用。
 
4.3.2 创作与合成平台——imageCreator创影
imageCreator创影是针对影像领域的新型短视频创作一站式合成平台。“创影”以三维渲染引擎为基础,集镜头脚本制作,素材剪辑,人物配音,视频包装,字幕合成与一体,同时将AI技术与虚拟数字人完美结合,全新定义视频制作流程,无需专业视频制作人员,通过简单拖拽即可在几分钟内制作出精美的短视频。
主要功能:
■二维三维场景调用:
产品支持可以直接导入图片/视频作为背景,可以直接加载UE引擎的.umap文件关卡,直接调用UE三维场景。
■二维虚拟数字人导入调用:
产品支持二维虚拟主持人形象定制导入,还原度不低于99%。产品支持真人音色克隆调用,音色相似程度不低于99%
■三维虚拟数字人导入调用:
产品支持三维虚拟人形象导入,支持自定义设置三维虚拟人动作
■镜头切换:
产品支持添加不限量的镜头,可以展现远景,中间,近景,特写等多种效果,并可以根据文稿内容实时切换镜头。
■场景嵌套:
产品支持带alpha通道的图片或者视频进行虚拟大屏的嵌套,可在场景中实时播放素材
■素材粗剪:
产品支持素材粗剪功能,可在软件中进行素材简单剪辑,设置入出点。
■转场效果:
产品支持在不同镜头之间添加不同类型的转场特效,并且可以自定义转场时长
■AI配音:
产品支持不少于80种配音音色可供选择,并支持实时试听
■智能字幕:
产品支持自动配音并自动生成字幕,支持自由调整字幕属性
■视频包装:
产品支持添加前景包装效果,如贴图,人名条等
■三维场景漫游:
产品支持三维场景漫游功能,可通过键盘wasd控制摄像机探索三维场景来进行镜头选择
■PPT导入:
产品支持直接文稿和ppt导入功能,可直接将现有稿件或ppt一键导入
■Ai写稿:
产品支持使用AI智能写稿,按要求输出对应稿件
■多类型输出:
产品导出的视频支持选择多种视频格式、码率、帧率参数(支持 MP4、MOV 、TS和 MXF 格式, 支持 MPEG-2、MPEG-4 和H.264 、H.265等编码方式以及 1Mbps 到 100Mbps 可调的码率)

4.3.3 数字人交互平台——imageKnow元智
imageKnow元智是一套多模态人机交互系统,提供快速打造智能、有形象、可交互的“数智分身”的解决方案。结合语音、图像和文字的多模态互动,以及搭载知识库与知识大模型的智能引擎。imageKnow元智助力您实现数智化转型。个性化定制形象,使您的分身更具个性和亲近感。选择imageKnow元智,是选择开启智能互动未来的一步。数智互动,从简单而强大的imageKnow元智开始。
主要功能:
■个性化形象定制:
软件支持用户根据自己的喜好和需求,轻松定制自己数字分身的形象。
■大模型接入:
软件支持借助各类自然语言大模型,使得imageKnow元智能够拥有出色的语言理解和生成能力,提供更高水平的对话交互,精准还原用户意图。
■自适应智能对话生成:
软件基于大模型的深度学习技术的智能对话生成,能够个根据用户的语境和偏好生成更为自然,个性化的对话内容。
■知识库与大模型模型协同:
软件支持集成自己的知识库,并借助强大的自然语言模型,实现高效的信息检索和综合分析,为用户提供深度的、实时的知识服务。
■多模态深度融合:
软件将语音、图像和文字进行深度融合,通过神经网络模型实现高度智能化的多模态互动,问题回复不但支持语音和文字,还支持图片或视频,使用户体验更为自然和全面。
■高度准确的语音识别功能:
软件利用先进的语音识别技术,能高度准确的将接受到的语音转换为文本,并时刻打印为字幕展现,使用户进行语音交互时的体验更为顺畅。
■真三维场景导入:
软件支持真三维场景导入并作为数字人背景使用,为用户交互满足不同的应用场景,提供更丰富的内容。
■多种配音选择:
软件支持上不少于150种配音音色进行选择,适配不同的人物形象及应用场景。
   
4.3.4 数字人直播平台——imageLive幻象
imageLive幻象,定义未来直播全新方式,以先进的技术为基石,打破传统直播界限,为用户呈现出真实而引人入胜的直播内容。每位主播都是数字科技的杰出作品,通过巧妙的数字化能力及AI技术,带给观众前所未有的数字直播体验。在幻象的舞台上,数字人不仅仅是一个静态影像,更是通过先进的互动技术实现真实感知和智能回应观众的互动。无论观众身处何地,都能透过数字人直播,打开通往AI数字时代的未来之门。
主要功能:
■特色形象人物定制:
软件支持用户根据自己的喜好和需求,轻松定制自己数字分身或虚拟形象进行直播。
■多形象及音色选择:
软件除定制的形象外,还提供多个不同虚拟主播形象免费试用,同时支持不少于150中配音音色可供选择。
■多种直播模式:
软件支持多种脚本驱动,音频驱动,真人接管,智能交互等多种模式进行直播驱动。
■自定义知识库导入:
软件支持自定义的知识库直接导入,可根据现有知识库进行直播内容交互。
■多终端直播:
软件支持将直播内容推流到各终端平台和输出渲染窗口。
■直播模版套用:
软件提供多个预制直播模版可直接使用,同时也支持自定义模版制作并保存,方便用户快速完整直播间搭建。
 
4.4 基于大模型的智能知识库问答平台
基于大模型方案,高效检索文档信息,准确回答专业问题,提供Al分析、阅读、问答工具,让大模型助你高效了解知识内容。将文档(PDF、doc/docx或txt)导入系统后,将形成基于有关文档的业务知识,可直接根据文档中的内容对用户问题进行解答,整合专业知识库和学科特定数据,将这些数据自动拆分、向量化等,使其能够提供精准的回答。
支持多种文档格式上传学习,word、pdf、md、txt、html等,实现基于大语言模型的本地知识库的问答应用,目标建立一套对中文场景可离线运行的知识库问答解决方案,并支持将知识库的大脑接入到虚拟教师的数字分身形象中,使虚拟孪生老师有自己的思想和意识帮助或辅助教学。
 
4.4.1 技术架构
"smartKnowledge晓言"基于先进人工智能技术的文档问答平台,采用了模块化的技术架构以提供高效、精准的文档解析和智能问答服务。在数据处理层,平台支持多种文档格式,通过自动化的预处理系统清洗和标准化数据,保证信息的准确传递。核心处理层使用最新的自然语言处理技术,结合深度学习模型,能够深入理解文档内容并提取关键信息。AI问答引擎通过动态算法实时响应用户查询,精确生成相关答案。

4.4.2 主要功能
■支持多种文档格式导入学习:
"smartKnowledge晓言"支持广泛的文档格式,文档文件及QA问答对,包括但不限于txt、docx、pdf、html、Markdown、excel、csv。多格式支持确保用户可以轻松上传和处理从文本文件到复杂的各种文档,平台能自动提取学习各类文档的相关知识点并向量化,形成对应知识库。
■支持市面多种大语言模型:
平台支持对接主流的大模型,包括本地私有大模型(如 Llama 2)、OpenAI、通义千问、Kimi、Azure OpenAI 和百度千帆大模型等,拥有可视化界面,快速接入大语言模型使用。
■支持完全本地化部署:
为了保护企业的数据安全和隐私,"smartKnowledge晓言"支持完全本地化的部署选项。用户可以在自己的私有服务器或云环境中部署该系统,从而完全控制自己的数据和知识资产,无需联网使用。
■具有用户管理功能:
管理员可以创建用户,以让他们可以独立工作,部署自己的知识库并使用,也可以将其加入到团队成员里,设置他们可以使用的知识库和应用权限。
■支持将应用生成公开访问链接(网址):
平台支持将设置好的应用直接生成公开访问链接,在网络上直接访问,不需要登陆帐号,同时具有会话历史记录。
■支持自动生成代码嵌入第三方:
可以将设置好的应用,自动生成代码,全屏显示或者浮窗显示,快速集成到用户的app或者网页上。
■支持设置访问限制:
限制客户端每天提问次数,也可以设置嵌入第三方的白名单。
■支持查看用户使用统计:
可视化显示用户数量、提问次数、Tokens使用总数等,对知识库的使用情况了如指掌。
■支持查看用户对话日志:
可以查看用户的对话日志,根据问题进行改进标注,设置问题的回答内容,并将此问题保存到文档里,让下一次问题得到更精确的回答。
■多知识库多应用建立管理:
支持用户创建和管理多个知识库和应用,使不同的项目或部门可以根据自己的特定需求建立和维护独立的知识库。平台可为大型组织提供了高效管理和利用内部知识资产的能力。
 
■数字人快速接入:
支持将晓言的知识库直接接入到元笃数字人当中去,与元笃数字人相配合,用于数字助教,前台迎宾,智能导览等多种交互场景。
   

4.4.3 产品优势
■广泛文档支持:
“smartKnowledge晓言”支持多种常见的文档格式,如txt、doc、docx、pdf、html、PPT和PPTX,且单个文档大小最大可支持200mb。这一优势确保了用户可以在一个平台上处理各种类型的文档,减少了转换文件格式的麻烦,极大提高了工作效率。
■用户友好的界面设计:
“smartKnowledge晓言”设计注重用户体验,提供直观、易用的界面,用户可以轻松上手并高效操作,降低了学习曲线和使用门槛。
■完全本地化部署:
“smartKnowledge晓言”支持完全本地化部署,本地调用亿级参数大模型,允许用户在自己的私有服务器环境中,保证用户数据安全和隐私。
■高效的数据处理和响应能力:
“smartKnowledge晓言”凭借高性能的硬件配置和软件架构,在数据处理和响应速度上表现优异,确保用户能够快速获得所需信息,提升整体工作效率
■极强的可扩展性:
“smartKnowledge晓言”采用模块化设计,具备良好的扩展性。用户可以根据需要添加新的功能模块或升级现有功能,接入自己需要的大模型或搜索引擎,确保平台能够随着企业需求的变化而不断发展
■完美结合数字人生态:
“smartKnowledge晓言”可以完美融入数字人生态,训练出来的模型可与数字人、imageLive幻象数字直播、iMageCreator创影等产品完美结合,应用与多种不同场景

4.4.4 应用场景
■招生政策与咨询问答:
招生办可以通过将招生政策整理上传到知识库,智能问答系统会将这些文档信息进行提取和回答,帮助预备新生进行招生政策的了解,提升咨询体验。
■知识库建设与管理:
系统可以根据不同学科和专业的需求,建立专门的知识库,提供专业化的问答服务,支持学生的学科学习和专业发展。
■图书馆与信息服务:
图书馆可以将电子书籍和文献资料上传到系统,智能问答系统可以提供基于这些文档的问答服务,方便师生查阅和利用图书馆资源。可以上传图书馆信息文档,系统会根据文档内容提供精准的查询结果,提升信息服务水平。
■行政管理与服务:
学校管理人员可以上传各类学校政策、规章制度和通知文件,智能问答系统可以帮助师生快速查询相关信息,提升行政管理效率。


 
 
   
销售电话:010-82608898     技术支持:82608898-800    Email:sales@gexin.com.cn
Copyright © 2012-2024 版权所有:北京革新创展科技有限公司   京ICP备20004067号-1