免费安卓手游下载、分享游戏攻略、电脑硬件资讯、数码科技最新资讯
当前位置: 首页 > 硬件资讯 > 新型AI绘图系统助力人机协作,模仿人类素描过程

新型AI绘图系统助力人机协作,模仿人类素描过程

时间:2025-06-09 23:20

小编:小世评选

在我们的日常交流与沟通中,语言有时显得力不足,在表达复杂想法时,简单的视觉草图往往更为高效。例如,使用电路图来说明一个系统的工作原理,能够迅速传达概念。若能引入人工智能来助力这一可视化表达,便可探索出更为广阔的可能性。

目前,虽然许多AI系统在创作写实油画或卡通插画上颇具实力,但它们对于素描过程的理解仍显不足。素描的魅力在于那种逐笔勾勒、反复迭代的过程,这一过程不仅是艺术创作的重要组成部分,也是人类头脑风暴、调整创意的重要工具。为了填补这一空白,麻省理工学院计算机科学与人工智能实验室(CSAIL)与斯坦福大学的研究团队近期开发了一种新型绘图系统,旨在通过人机协作的方式,让AI 模仿人类的素描过程。

论文的第一作者、CSAIL的博士后研究员Yael Vinker指出:“人们往往未意识到自己在日常生活中绘制了多少草图。人类利用速写来理清思路、交流创意,因此,我们的工具旨在模拟这一过程,以便使得多模态语言模型能够更有效地辅助人类进行视觉化表达。”

一般意义上的文本转图像模型,如DALL-E 3,能够生成视觉上引人注目的绘画作品,但缺乏素描过程中自发性与创造性的深度。新开发的系统则从根本上改变了这种局面,它把绘画过程视作一系列连贯的笔触,生成的艺术作品呈现出更加自然流畅的特征,犹如真实的人类素描。

此前的研究通常依赖于人类绘制的数据集进行模型训练,这些数据规模和多样性受限,因此新系统的开发显得尤为重要。该团队采取了全新的路径,直接调用预训练的语言模型。这些模型虽然掌握了海量的概念,但并不知道如何进行素描。不过,经过研究团队的教导,这些模型逐步学会了从未明确训练过的概念进行逐笔创作。

通过独创的“素描语言”,研究者赋予AI模型逐笔绘制的技能。这一方法无须依赖庞大的训练数据,而是将草图转化为经过编号的笔触序列。例如,在绘制房屋的过程中,每一道笔触都标注着对应的建筑元素,帮助模型理解新概念。

作为一种高度灵活的多模态大语言模型,该系统可以接收三类输入:包含素描语言规范的系统提示;带有具体绘图任务的用户提示(如“画一条鲨鱼”);以及空白的绘图画布。基于用户的指令,该系统生成一系列代表绘制笔触的文本响应,经过处理后将这些笔触数据显示在画布上。画布不仅可以进行循环利用,还允许用户通过更新提示来修改图案或生成新任务,与AI进行协作绘图。

研究团队还验证了这一系统在独立创作和人机协作方面的能力。在协作模式下,AI与人类共同完成特定概念的绘画,有研究表明,移除AI贡献的笔触后,整体图像图案的完整性会受到严重影响。例如,去掉代表帆船桅杆的笔触后,整幅作品会变得难以辨认。这一发现显示了AI在创作过程中的重要性和必要性。

通过这种基于Web的协作式草图绘制环境,用户可以与AI在共享画布上轮流绘制,创作出可以识别的草图。参与者根据给定的文本概念,以单人模式(独立绘制)或协作模式(共同添加笔触,直至满意)进行创作。不同颜色的笔触清晰地显示了用户与AI的贡献。

用户还可以利用聊天对话功能,反复编辑已有草图,增强创意表达的灵活性。研究团队展示了这种系统的多样性,包括绘制的各种草图概念,并指出其未来的可能用途——例如,开发为互动艺术游戏,作为教学工具帮助教师和研究者图解复杂概念,甚至提供快速的绘画教学。

用户还能将草图转变为动图。在另一个实验中,研究团队利用不同的多模态语言模型进行测试,结果显示,Claude 3.5 Sonnet生成的矢量图形最具人性化特征,表现优于其他模型,出该模型处理视觉信息的能力颇具独特性。

“随着模型在草图生成等多样化能力上的提升,用户将能够获得更为直观且人性化的表达方式,这将丰富交互体验,提升AI的易用性与适应性。”合著者Tamar Rott Shaham补充道。

尽管这一新系统展现了绚丽的前景,在协作过程中也偶尔出现误解的情形,比如错画出双头兔子。Vinker解释,这可能是由于模型的“思维链”推理机制,任务在分解为多个步骤时,模型可能未能正确识别用户的具体意图。他们计划通过合成数据扩散模型来进一步优化相关绘图技能。

随着这一新型绘图系统的推行,人机协作将迎来一个崭新的时代。未来,研究团队还将致力于优化这一交互界面,以简化与多模态语言模型的协作绘画流程。相信在不久的将来,AI能以更加符合人类思维方式的绘画形式,协助我们绘制出更加丰富的创意和概念。

精品推荐

相关文章

猜你喜欢

更多

热门文章

更多