ISSN 2095-9184
中国学者发起的新一代人工智能研究顺应了信息新环境变化的需求,力图将传统人工智能(人工智能1.0)推进到人工智能2.0的新阶段。作为人工智能的重要组成部分之一,群体智能1.0(群智能)正在向群体智能2.0(众智能)阶段发展。通过深度剖析和翔实论证,发现群体智能1.0与群体智能2.0存在不相容性,据此搭建它们之间的桥梁——以生物合作行为仿生为主的群体智能1.5,作为群体智能1.0到群体智能2.0的过渡,以实现两者的相容。进而对钱学森提出的大成智慧进行新的诠释,将其作为人类智慧仿生的高级阶段——群体智能3.0,指出在深度不确定性下的大模型和大数据的双轮驱动是从群体智能2.0通向群体智能3.0的进化途径并加以阐述,由此提出群体智能的4个发展阶段,形成由上述阶段共居一体所组成的群体智能发展的完整架构,这些不同阶段渐进发展,具有良好的相容性。鉴于合作在群体智能发展阶段中的主导作用,分别论述群体智能中的3种合作类型:低等生物的间接调节型合作、高等生物的直接沟通型合作和人的共享意向型合作。在群体智能中,分工乃是实现合作的主要形式,为此阐释分工行为复杂性与分工类型的关系。最后,基于对所提出的群体智能4个发展阶段整体架构的全方位认识,对群体智能未来的发展方向和研究前景进行展望。
本文概述了基于基础模型和并行智能开发基础、基础设施机器人、机器人技术的初始步骤和基本框架,以及新型人工智能技术(如AlphaGO、ChatGPT和Sora)的潜在应用。
藏式围棋面临专家知识和研究文献匮乏的问题。因此,我们研究了有限计算能力资源下藏式围棋的零学习模型,并提出一种新颖的尺度不变U型网络(U-Net)风格的双头输出轻量级网络TibetanGoTinyNet。该网络的编码和解码器应用了轻量级卷积神经网络(CNN)和胶囊网络,以减少计算负担并提升特征提取效果。网络中集成了数种自注意力机制,以捕获藏式围棋棋盘的空间和全局信息,并选择有价值通道。训练数据完全由自我对弈生成。TibetanGoTinyNet在与Res-UNet,Res-UNet Attention,Ghost-UNet和Ghost Capsule-UNet4个U-Net风格模型的对弈中获得了62%–78%的胜率。在捕获棋盘位置信息的轻量级自注意机制消融实验中,它也实现了75%的胜率。当模型从99棋盘直接迁移到1111棋盘时,该模型在不同的蒙特卡洛树搜索(MCTS)次数下节省了约33%的训练时间,并获得了45%–50%的胜率。本文模型代码可在https://github.com/paulzyy/TibetanGoTinyNet上获取。
地面高程估计对于无人驾驶汽车和智能机器人的许多应用至关重要,包括三维物体检测、导航空间检测、用于定位的点云匹配和用于建图的配准。然而,现有大多数工作将地面视为没有高度信息的平面,导致这些应用中出现不准确的操作。本文提出一种端到端的轻量级方法GeeNet,可几乎实时地补全地面,同时在基于网格的表示中估计地面高程。GeeNet利用二维/三维卷积的混合来保留轻量级架构,以回归网格每个单元格的地面高程信息。GeeNet首次实现了语义场景补全的地面高程估计。使用SemanticKITTI和SemanticPOSS数据集对GeeNet进行验证,展示了其在地面高程估计和点云语义场景补全方面的定性和定量性能。此外,其跨数据集泛化能力也得到实验证明。相比文献方法,GeeNet取得更好性能,并以0.88 ms运行时实现地面高程估计和地面补全。
工业互联网、云计算、大数据技术的融合正在改变产业链的经营和管理模式。然而,产业链涉及领域广泛、发展环境复杂、影响因素众多,给工业大数据的高效整合与利用带来挑战。针对当前产业链物理空间与虚拟空间的融合,本文建立基于工业互联网的产业链数字孪生系统框架。进一步,本文提出一种基于知识图谱的产业链信息模型,以整合复杂异构的产业链数据并抽取产业知识。首先,建立产业链本体,提出基于科技成果的实体对齐方法。第二,提出基于Transformer的双向编码器表示(BERT)与多头选择模型的产业链信息实体关系联合抽取方法。第三,提出基于关系图卷积网络与图采样聚合网络的关系补全模型,该模型同时考虑了知识图谱的语义信息和图结构信息。实验结果表明,本文所提出的实体关系联合抽取模型和关系补全模型的性能明显优于其他基线模型。最后,本文基于基础机械领域的18条产业链数据建立了产业链信息模型,证明了该方法的可行性。
在平面设计中,布局是前景设计元素和背景图像相互作用的结果。然而,现有的研究主要集中在提高布局生成算法性能上,忽略设计师在现实世界中应用这些方法时所必需的交互性和可控性。本文提出一个以用户为中心的布局设计系统Iris,它为设计师提供了一个交互式的环境加快工作流程。该环境支持用户约束输入、布局生成、自定义编辑和布局渲染。为满足设计师指定的多种约束,引入一种新的生成模型——多约束 LayoutVQ-VAE,以推进在域内和域间多种条件约束下的布局生成。对所提模型进行定性和定量实验。实验结果表明,该模型在多个方面的表现优于目前最先进的模型或可与之相媲美。对Iris系统的用户研究进一步表明,该系统在显著提高设计效率的同时,也实现了接近人类设计师的布局设计。
车辆轨迹聚类方法作为时空交通数据挖掘的重要工具之一,被广泛地运用于挖掘车辆的行为模式。但是如果直接将原始车辆轨迹数据上传到服务器并进行聚类则具有隐私泄露的风险。因此,针对在保护用户隐私的同时进行车辆轨迹聚类这一挑战,本文提出一种隐私保护下的车辆轨迹聚类框架,并构建了基于变分自编码器和改进K-means算法的车辆轨迹聚类模型(IKV)。在该框架中,客户端计算出车辆轨迹的隐藏变量并上传至服务端,服务端再利用隐藏变量计算出聚类结果,并将分析结果发放给各客户端。IKV的工作流程如下:首先利用历史车辆轨迹数据在变分自编码器上进行训练,当变分自编码器的解码器接近原始数据时,将变分自编码器的编码器部署到车辆端的边缘计算设备;其次由车辆端的编码器计算车辆本地轨迹数据的隐变量,并将隐变量上传至服务器端;最后在服务器端利用改进的K-means算法基于车辆上传的隐变量进行车辆轨迹聚类计算。在三个真实数据集上,我们将IKV与多种基准方法在多个评价指标上进行了比较。在9组性能对比实验中,IKV算法在6组中达到了最优或接近最优的性能水平。同时在9组敏感性分析实验中,该算法在7组实验中展现出了显著的稳定性和对参数变化的鲁棒性。这些结果验证了本文提出的框架不仅适用于注重隐私的生产环境,如拼车服务,而且由于其对聚簇数量的低敏感性,还能适应不同规模的聚类任务。
随着碳达峰、碳中和政策的制定与实施,电网新能源化成为了主流趋势。然而,配电网中光伏装置数量的增加已经给分布式配电网系统带来巨大的有源电压调控压力,使得传统电压调节模式难以适应新能源化电网系统。基于多智能体强化学习的智能控制策略可通过智能逆变器和其他智能建筑能源管理系统(楼宇微网)缓解这些问题。为了获得楼宇微网的最佳能源管理策略,并满足楼宇用户的舒适度和能源需求,本文提出两种大规模多智能体策略评估方法,将能源管理问题转化为一般和博弈,同时优化了系统和楼宇用户两个层面的收益。α-rank算法虽然可解决一般和博弈,并在理论上保证策略排名的可靠性,但其受到策略交互中的采样复杂度限制,难以应用于实际电力系统。通过引入张量补全拓展α-rank算法,本文提出一种新的评估算法TcEval,以降低交互中的采样复杂性。此外,考虑到实际场景中普遍存在的噪声问题,本文建立了基于领域知识的噪声处理模型来计算策略收益,提出了针对噪声场景的TcEval-AS算法。多组基于实际数据的能源管理案例实验说明,本文提出的两种评估算法相较于现有方法(RG-UCB和α-IG)大幅度降低了策略评估中采样复杂度。最后,用实际数据验证了所提算法的有效性。
掺镝氟化物光纤激光器在环境监测、实时传感和聚合物加工等方面具有重要应用。目前,在>3 μm的中红外区域获得高效率、高功率的掺镝氟化物光纤激光是科技前沿领域。通常,掺镝氟化物光纤激光器采用单向泵浦方案,但其存在光纤端面高热负载密度的缺点,限制了功率的提升。本研究基于速率方程和传输方程,数值研究了一种双向同带泵浦方案,旨在解决3.2 μm掺镝氟化物光纤激光器输出功率提升的限制,并提升其效率。仿真结果表明,双向同带泵浦的掺镝氟化物光纤激光器的光光效率可达75.1%,接近斯托克斯极限87.3%。同时,讨论了进一步提高掺镝氟化物光纤激光器效率的潜力。与单向泵浦相比,双向泵浦方案除了高效率外,还具有减轻光纤端面热负荷的固有优势。因此,该方案有望显著提高掺镝氟化光纤激光器在中红外波段的输出功率。
Suno因其出色的音乐生成能力受到广泛关注,其不仅展现了音乐人工智能技术的进步,也为音乐创作开辟了新的可能,是音乐人工智能生成发展的一个里程碑。本文介绍音乐人工智能生成的技术背景,总结音乐人工智能生成的通用技术框架,分析Suno的优势和局限,并讨论音乐人工智能的未来趋势。