DevianArt
重点新闻(1118~1124)
生成式AI近来如火如荼发展,但也引发不少问题。比如文字转图像AI,就有画作版权问题,为此,DeviantArt打造一款文生图AI,赋予创作者同意权和加注权,可拒绝将自己的作品让模型使用。另一方面,生成式AI也有Deepfake问题,英特尔打造一套系统来揪出Deepfake假影片。在AI应用部分,则有专家探究树状模型分析表格数据的能力比深度学习模型好,IBM与PyTorch也发现大型AI模型在云端训练的加速方法,AWS正式推出整合机器人的服务,而Nvidia释出新工具来加速医疗AI应用的打包和测试;同样是医疗AI,台北慈济揭露要开发更多影像AI,如气胸、心脏肿大。最後,Meta成功研发能执行复杂游戏任务的AI系统,可制订策略、说服玩家并取胜。
DeviantArt DreamUp 文生图
新做法!DeviantArt打造文生图AI,还赋予创作者同意权和加注权
随着多模态AI发展,这两年出现不少文生图(即文字转图像)大型模型,如OpenAI的DALL-E 2、Google的Imagen和Parti,虽能产生创新细腻的画风,却也引发AI画作夺下美国艺术大赛首奖的争议,以及AI产出的画作版权问题。
为解决版权问题、保障艺术家权益,知名线上数位艺术交流社群DeviantArt近日打造一款文生图AI模型DreamUp,是开源文生图产生器Stable Diffusion的一般实作,利用网路上的画作训练而成。它可让使用者输入文字,甚至可输入想产出哪位画家的风格,来生产画作。但不同的是,他们给予艺术创作者决定权,来决定是否要让自己的作品,出现在模型训练资料集中,以及是否开放让DreamUp产出自己创作风格的画作,若同意,系统会在AI产出的画作上加注标签,给予认可。
不过,根据官网最新资讯,DeviantArt宣布,所有在DeviantArt上发布的作品,都不会作为DreamUp和第三方AI模型的训练资料。(详全文)
决策树 表格数据 类神经网路
为何决策树在处理表格数据比类神经网路好?专家找到原因
虽然类神经网路在语音、文字和图像处理方面表现优越,但对於表格类数据的预测,却仍不如决策树及其变形演算法。法国国家讯息与自动化研究所(Inria Saclay Centre)和索邦大学联手研究,他们先以45个表格资料集,如电价涨跌和房市预测等资料,来训练多个类神经网路和树状模型,像是ResNet、Transformer模型,以及XGBoost、随机森林、梯度升高机等。
接着,他们对每个模型训练400次,在预训练超参数空间中随机搜寻。再来,他们根据测试集准确率和回归模型R2值,来评估模型的分类表现。团队发现,树状模型的表现比深度学习模型好上2、3成,但在另一个平滑标签的实验中则发现,树状模型用平滑标签训练,表现下降得比神经网路还多,也就是神经网路比较适合平滑标签,而树状模型学习不规则映射标签的能力较好。(详全文)
英特尔 FakeCatcher Deepfake
准确率96%!英特尔新侦测技术能即时辨识Deepfake
英特尔推出可准确侦测Deepfake虚假影片的侦测器FakeCatcher,准确率高达96%!英特尔号称是全球首个能以毫秒即时回传结果的Deepfake侦测器。英特尔即时平台所使用的侦测器FakeCatcher,由英特尔与纽约州立大学研究人员共同开发,并在英特尔的硬体和软体上运作。
目前大多数深度学习侦测器,都是查看原始资料,试图找影片中不合理的线索。但FakeCatcher是判断影片人像的血流,也就是寻找影片中真实之处,来证明影片非合成。当人类的心脏跳动泵血作用发生时,静脉的颜色会发生改变,FakeCatcher收集脸部的血流讯号,并将这些讯号转换成时空图,由深度学习演算法立刻判断影片真伪。(详全文)
Nvidia 医疗影像AI MONAI Deploy
Nvidia推出新框架来加速医疗影像AI部署
Nvidia日前宣布推出MONAI Deploy框架,来加速医疗影像AI应用的部署工作。MONAI是一款开源的医疗影像AI框架,提供影像标注、AI模型开发和加速训练,至今已超过65万次下载。这次,MONAI框架中新添MONAI Deploy工具,来加速使用者将医疗AI应用,部署到既有的医疗生态系中。MONAI之所以能加速,是因为有MAP这个打包技术,简化AI模型的打包和测试过程,且MAP规格还整合了医疗资料交换标准,如DICOM,来提高互通性。
此外,不少公云业者也支援MAP和MONAI Deploy,如Amazon HealthLake Imgaing服务就与MAP连接器串联,使用者可即时查看、处理和分割影像,再来还有Google云的医疗影像套件、微软Azure的Nuance Precision Imaging Network,以及甲骨文Cloud Infrastructure,来让使用者在容器或自有平台上使用这些工具。目前采用MONAI Deploy的使用者有辛辛那提儿童医院、英国国民保健署医院、加州大学旧金山分校等。(详全文)
IBM PyTorch 大型模型
IBM联手PyTorch提高大型AI模型上云训练效率
IBM研究院与PyTorch合作,发展一套rate_limiter控制元件,能透过配置训练时的记忆体,让数十亿参数的模型,也能在标准云端网路基础设施(如乙太网路)上执行训练。
IBM表示,一般参数数十亿的模型,大多得在高效能运算(HPC)基础设施上执行,但对许多想要自己训练模型、自己使用的开发者来说,就是个大挑战。於是,IBM与PyTorch分散式团队合作,利用PyTorch的完全分片资料平行技术(FSDP)、开发FSDP API和rate_limiter控制元件,来控制用於发送和接收张量的记忆体,提高4.5倍效率。他们成功在IBM Cloud上的标准乙太网路训练110亿参数的模型,这个云平台算力由200个节点组成,每个节点有8张Nvidia A100 80GB显示卡,与96 vCPU、1.2TB CPU记忆体。该系统自5月开始运作,可完成大型模型端到端训练、微调和推理。(详全文)
Meta CICERO 外交
策略AI新成就!Meta新游戏AI与真人玩家谈判还获胜
Meta打造新AI系统CICERO,可在策略游戏《外交》中与其他人类玩家沟通,甚至说服其他玩家结盟、取得胜利,还跻入游戏排名前10%。《外交》这款游戏一直是AI难以克服的挑战,因需掌握、理解其他玩家的动机和观点,并制定复杂的计画,再以自然语言与其他人类玩家达成协议。
CICERO主要运用2种AI领域,一是策略推理,如AlphaGo中的代理,另一是自然语言处理(NLP),如GPT-3和LaMDA。比如,CICERO推论在游戏後期需要某玩家的支援,它就会从该玩家的角度来分析风险和机会,来拟订策略、得到该玩家的青睐。CICERO由一个可控的外交对话模型和一个策略推理引擎组成,在游戏的每个阶段,CICERO会查看游戏板和对话历史,然後对其他玩家可能采取的行动建模,并用来控制一个开放式对话的语言模型,来告知其他玩家模型的计画、提出合理的行动建议。最後,Meta也开源CICERO程式码。(详全文)
台北慈济 医疗AI 台湾人工智慧实验室
台北慈济要打造更多医疗影像AI
台湾人工智慧实验室(Taiwan AI Labs)日前与台北慈济医院签署MOU,要锁定医疗影像AI、早期预警等领域,打造创新应用来解决各种临床问题。特别的是,他们不只着重於研发,还着墨可信任、可解释AI,贴近行政院接下来要推动的第2期台湾AI行动计画方向。
目前,台北慈济的医疗AI应用有ICD-10疾病分类智能编码,可推荐医师诊断关联群DRG的最适组合,此外还有检体影像智能自动判读系统和血液细胞型态自动阅片分析仪,以AI来加速检验工作。而在临床方面,台北慈济也与华硕打造败血症预测系统,来即时预警败血症,降低院内败血症死亡率。
台北慈济医院赵有诚院长表示,这次与台湾人工智慧实验室的开发计画,将先锁定放射科与胸腔科,建置影像判读AI系统,来判读气胸、肺结核、心脏肿大等病灶。对台湾人工智慧实验室来说,与台北慈济联手是个重要起点,未来若能与各地慈济医疗体系串联,就能更广泛运用AI。(详全文)
AWS 机器人 IoT RoboRunner
AWS正式推出机器人机队管理服务
AWS正式推出机器人服务IoT RoboRunner,可用来打造机器人机队,让使用者控制机器人无缝协作、打造自动化应用。AWS指出,IoT RoboRunner可减少用户在开发机器人应用程式时,所面临的多供应商间互通性问题。进一步来说,IoT RoboRunner能从机器人机队管理器中收集和组合资料,并在集中式储存库中标准化机器人状态、位置等资料类别,提高互通性。系列功能包括机队管理系统闸道器,能用於管理机器人供应商和IoT RoboRunner的介接,而Shared Space则可在共用空间中协调机器人。(详全文)
图片来源/DeviantArt、Inria Saclay Centre、Meta、英特尔
AI近期新闻
1. OpenAI API释出更强大的GPT-3新模型Davinci
资料来源:iThome整理,2022年12月