全国服务热线 4001334566
语言
关于我们

Company Profile

[技术前沿]利用生成式人工智能设计更好的机器人

03-25

它没有向我展示原理图,但确实激发了我的创造力。

2023年,或许可以称为生成式人工智能之年。生成式人工智能是否会让我们的生活变得更好,仍然没有答案,但有一点是肯定的:新的人工智能工具正在迅速涌现,并将在未来持续一段时间。工程师们在试验这些工具的过程中获益良多,于是将它们纳入设计过程。

这已经在某些领域成为现实。以阿斯顿•马丁的DBR22概念车为例,设计师们依靠集成在Divergent技术公司的数字3D软件中的人工智能,对后副车架部件的形状和布局进行优化。在此过程中,人工智能探索不同的形式,使得后副车架看起来像是拥有了有机的骨骼架构。实际应用的部件是通过增材制造工艺生产的。阿斯顿•马丁表示,这种方法大大减轻了部件的重量,同时又保持了部件的刚性。该公司计划在即将推出的小批量车型中使用相同的设计和制造工艺。

人工智能辅助设计的其他例子可以在美国国家航空航天局的太空硬件中找到,包括行星仪器、太空望远镜和火星样本返回任务。美国国家航空航天局工程师莱恩•麦克利兰(Ryan McClelland)表示,人工智能生成的新型设计可能“看起来有点陌生和奇怪”,但它们能承受更高的结构载荷,重量却比传统组件更轻。此外,与传统组件相比,设计只需要花费很小一部分时间。麦克利兰称此类新设计为“进化结构”。这个短语指的是人工智能软件通过设计达成迭代突变,实现高性能设计。

图片
美国国家航空航天局研究工程师莱恩·麦克利兰使用商业人工智能软件设计了这些3D打印组件,他将此称之为“进化结构“

在此类工程环境中,利用生成式人工智能,高质量的结构化数据和经充分研究的参数联合设计确实能够带来更具创意、更有效的新设计。我决定试一试。

在2022年1月,我开始在网络物理系统的部分工作中试验生成式人工智能。网络物理系统涵盖了广泛的应用,包括智能家居和自动驾驶汽车。它们依赖于物理和计算组件的集成,组件之间通常有反馈回路。要开发网络物理系统,设计师和工程师必须协同工作并要有创造性的想法。这是一个很耗时的过程,我想知道人工智能生成器能否帮助扩展设计选择的范围、实现更有效的迭代周期,或促进不同学科之间的合作。

开始进行生成式人工智能实验时,我想要寻找的并非有关设计的具体指导,而是灵感。最初,我只是出于好玩而尝试了文本生成器和音乐生成器,但我最终发现,图像生成器最合适。图像生成器是一种机器学习算法,可以根据一组输入参数或提示词来创建图像。我测试了多个平台,努力了解如何在每个平台上形成良好的提示词(即生成器用于生成图像的输入文本)。我尝试过的平台包括crayyon、DALL-E 2、Midjourney、NightCafé和Stable Diffusion,最后发现Midjourney和Stable Diffusion的组合最适合我的目标。

Midjourney使用专有的机器学习模型, Stable Diffusion则免费提供源代码。Midjourney只能在有互联网连接的情况下使用,提供不同的订购方案。Stable Diffusion可以免费下载到电脑上运行并使用,也可以支付象征性的费用在线使用。我在本地机器上使用Stable Diffusion并订购了Midjourney。

在生成式人工智能的首次实验中,我用图像生成器联合设计了一个水母机器人。我们计划在瑞典乌普萨拉大学的实验室里制造这台机器人。我们的团队专门研究受自然启发的网络物理系统。我们设想水母机器人从海洋中收集微塑料,并成为海洋生态系统的一部分。

图片
在早期尝试生成水母机器人的图像时,作者使用了这样的提示词:水下、自给自足、迷你机器人、珊瑚礁、生态系统、超现实。(左上)通过进一步完善提示词,作者得到了更好的结果。对于(上中),她使用了这样的提示词:水母机器人、塑料、白色背景。(右上)结果源于这些提示词:未来主义水母机器人、高精度、生活在水下、自给自足、快速、自然灵感。随着作者在提示词中添加了更多细节,她得到的图像与自己对水母机器人的看法更为一致。(下左、中、右)由这些提示词产生:未来主义电动水母机器人设计为自给自足、生活在海底、水状或弹性玻璃状材料、变形人、技术设计、立体工业设计、马克笔风格、影院级高清、超高清、情绪分级、白色背景。

在实验室中,我们通常通过迭代过程来设计网络物理系统,包括头脑风暴、绘制草图、计算机建模、仿真、原型构建和测试。我们首先建立团队,根据系统的预期目的和限制条件提出原始概念。然后,制作粗略的草图和基本的CAD模型,实现不同方案的可视化。我们对最有前途的设计进行仿真,进行动力学分析并完善机械部件设计。在构建更完善的版本之前,我们搭建简化的原型以进行评估。通过广泛的测试,我们改进系统的物理特性并控制系统。这是一个相互协作的过程,但很大程度上依赖于设计师过去的经验。

我想看看使用人工智能图像生成器是否可以开启未曾想到的可能性。我开始尝试各种提示词,从一句模糊的描述到冗长而详细的解释。一开始,因为不熟悉这一工具和它的功能,我不知道怎么提问,甚至不知道该问什么。最初的尝试并未成功,这不难理解,因为我选择的关键字不够具体,也没有提供任何关于风格、背景或详细要求的信息。

当我尝试更精确的提示词时,设计结果开始看起来与我的设想同步。然后我尝试了不同的材质和材料,直到我对若干设计感到满意。

几分钟内便能看到原始提示词的结果真是令人兴奋,但要花数小时进行修改、重申概念、尝试新的提示词,并将成功元素整合到最终的设计中。

与人工智能共同设计的体验颇具启发性。提示词可以包含多种属性,包括主题、材料、环境、颜色,甚至是情绪。据我理解,好的提示词必须具体,因为设计要服务于特定的目的。另一方面,我希望得到令人惊讶的结果。在所知所想与想要但未知或无法想象之间,需要找到平衡。我知道,任何未在提示词中指定的内容都可能被人工智能平台随机分配给图像。因此,若想某个属性产生令人惊讶的结果,便可以不对其加以提示。但若想在结果中包含某些具体的内容,则必须加入在提示词中,并且你必须清楚重要的上下文或细节。你也可以加入关于图像组成的说明,如果设计工程产品,这将很有帮助。

作为调查研究的一部分,我想看看自己能在多大程度上控制共同创造的过程。结果是,有时有效,但大多数时候以失败告终。

下图中人形机器人设计图中出现的文字并非真正的文字;它只是图像生成器生成的字母和符号,是技术绘图美学的一部分。当我提示人工智能进行“技术设计”时,它经常会加入此类伪语言,可能是因为训练数据包含的技术图纸和蓝图示例中具有诸多相似文本。这些字母只是算法与这种风格的插图相关联的视觉元素。因此,人工智能遵循它在数据中识别的模式,即使文本本身并无意义。这是一个无害的例子,说明了此类生成器如何在没有真正理解的情况下,在训练中接受了怪癖或偏见。

图片
为生成人形机器人(左)的图像,作者从这个简单的提示词着手:人形机器人、白色背景。然后她试着生成一个带有摄像头双眼的人形机器人的图像(右)使用的提示词为:人形机器人、摄像头眼睛、技术设计、添加文本、全身角度、强壮手臂、V型身体、影院级高清、浅色背景。

当我试图把水母改成章鱼的时候,设计结果却变得惨不忍睹。这让我很惊讶,因为对于工程师而言,水母和章鱼看起来很相像——我要为这点向所有读到这篇文章的海洋生物学家道歉。为什么生成器设计的水母很正常,设计的章鱼如此僵硬,仿佛外星生物一般,结构上也不正确?这仍然是个谜。我再次假设这与训练数据集有关。

图片

作者使用相同的提示词生成了4张类似章鱼的机器人图像:未来主义电动章鱼机器人、技术设计、立体工业设计、马克笔风格、影院级高清、情绪分级、白色背景。

下方的两个图像是在上方图像创建几个月后创建的。它们看起来不那么粗糙,但仍然不像章鱼。

使用人工智能图像生成器制作了几个有希望的水母机器人设计后,我和团队一起进行设计审查,确定是否可以为真正的原型开发提供信息。我们讨论了哪些美学和功能元素可以很好地转化为物理模型。举例而言,许多图像中弯曲的伞形顶部可启发选择机器人保护外壳的材料。流动的触手可以为实现与海洋环境相互作用的柔性操纵器提供设计线索。看到人工智能生成的图像和抽象的艺术风格中不同的材料和成分,能够鼓励我们对机器人的整体形式和运动进行更为大胆的创造性思考。

虽然我们最终决定不直接复制任何设计,但人工智能艺术的生物形状激发了许多有益想法,促使我们进行进一步的研究与探索。这是一个重要的结果,因为工程设计师都知道,在尚未完成足够的探索之前就开始执行某些内容是很诱人的。例如,即使计算机生成概念是空想或不切实际的,也可以作为粗略的原型,服务早期的工程设计。设计公司Ideo的首席执行官蒂姆•布朗(Tim Brown)指出,这样的原型“让我们为了加快速度而慢下来。通过花时间制作理念原型,我们可以避免一些损失严重的错误,比如过早进行太过复杂的设计,或者长时间坚持软弱的想法等。”

在另一个场合,我试图使用图像生成器来显示智慧城市中通信的复杂性。

通常,我会在白板上创建图表,然后使用微软Visio、Adobe Illustrator或Adobe Photoshop等绘图软件,重新创建绘图。我可能会在现成的示意图库中寻找自己想要纳入的组件,包括车辆、建筑物、交通摄像头、城市基础设施、传感器、数据库。然后我会添加箭头来显示这些元素之间的潜在联系和数据流。例如,在智慧城市插图中,箭头可以显示交通摄像头如何将实时数据发送到云端,并计算与拥堵相关的参数,然后将优化路线数据发送到联网汽车。开发此类图表需要仔细考虑不同系统和需要传达的信息。这一过程需要完全专注于通信,并不适合自由探索不同视觉风格。

图片

图片

图片


作者尝试创建智慧城市的信息流图像,以这些提示文字为基础:图像显示了智慧城市中不同组件之间通信的复杂程度、白色背景、干净的设计。

我发现使用人工智能图像生成器可以比绘图软件提供更多的创作自由,但不能准确描绘智慧城市中复杂的相互关联。其结果是可以有效地表示许多单独的元素,但它们在显示信息流和交互方面并不成功。图像生成器无法理解上下文或表示关联性。

在使用图像生成器数月之后,并将其推向极限,我得出了这样的结论:它们可以用于探索尝试、寻找灵感和生成快速插图,在头脑风暴会议上与同事进行分享。即使图像本身并不是现实或可行的设计,也可促使我们想象可能没有考虑到的新方向;即使是不能准确传达信息流的图像,也仍然能够起到作用,推动头脑风暴取得成效。

我也了解到,与生成式人工智能共同创作的过程需要毅力和奉献精神。虽然快速获得良好的结果是有益的,但如果你有特定的议程且寻求特定的结果,这些工具就很难管理。此外,人类用户几乎无法控制人工智能生成的迭代,迭代的结果也不可预测。当然,也可以继续迭代,以期获得更好的结果。但就目前而言,几乎不可能控制迭代在哪里结束。无论如何,我不能说共同创作的过程完全由人类主导,至少不是现在的人类。

我注意到,自己在整个过程中的想法、表达想法的方式,甚至自己对结果的看法都发生了变化。很多时候,我在开始设计时都会有一个特定的想法,例如,了解特定的背景或材料。经过几次迭代后,我发现自己选择的基于视觉特征和材料的设计,往往是我在第一次提示中没有指定的内容。在某些情况下,我的特定提示词不起作用;相反,我必须使用能够增加人工智能艺术自由度的参数,同时降低其他指标的重要性。所以,这一过程不仅允许我改变设计过程的产出,也允许人工智能改变设计,也许还会改变我的想法。

自从开始实验以来,我使用的图像生成器已经更新了很多次,我发现更新的版本使结果更可预测。如果你的主要目的是看到非常规的设计概念,预测性往往并不如意,不过我可以理解,在与人工智能合作时需要更多的控制。我认为,在未来,我们将看到工具在定义良好的约束条件下实现更可预测的执行结果。更重要的是,我希望看到图像生成器与许多工程工具集成,看到人们将这些工具生成的数据用于训练。

图片

当然,使用图像生成器会引发严重的伦理问题。它们可能会放大训练数据中的群体偏见和其他偏见。生成的内容有可能传播错误信息,侵犯隐私和知识产权。关于人工智能生成器对艺术家和作家生计的影响,许多担忧也合情合理。显然,在数据源、内容生成和下游使用方面需要透明、监督和问责。我认为,任何选择使用生成式人工智能的人都必须认真对待这些问题,以合乎道德的方式使用生成器。

如果能确保生成式人工智能的使用合乎道德,我相信这些工具可以为工程师提供更多东西。与图像生成器的共同创作可以帮助我们探索未来系统的设计。这些工具可以改变我们的思维方式,把我们带出舒适区——这是在启动严格的工程设计秩序之前,设法制造少许“混乱”的办法。借助人工智能的力量,工程师们可以开始以不同的方式思考、更清楚地找出关联、考虑未来的影响并设计出可持续的创新解决方案,改善世界各地的人们的生活。

作者:Didem Gürdür Broo

Copyright © 2011-2023  北京天华中威科技有限公司 版权所有 京ICP备2023011416号-1 All Rights Reserved