Bootstrap
从连续两届图灵奖(2018-2019)看GPU发展史

多年以后,面对图形处理器(GPU)在人工智能、加密货币、高性能计算、自动驾驶等多研究领域的广泛应用,如今的游戏发烧友们是否会回想起,1999年Nvidia发布专业游戏显卡GeForce256时那个炎热的夏天?

从连续两届图灵奖(2018-2019)看GPU发展史

多年以后,面对图形处理器(GPU)在人工智能、加密货币、高性能计算、自动驾驶等多研究领域的广泛应用,如今的游戏发烧友们是否会回想起,1999年Nvidia发布专业游戏显卡GeForce256时那个炎热的夏天?

《几何代数计算入门(计算机视觉)》

几何代数计算(计算机视觉)

全网唯一秃头数据集:20 万张人像,网罗各类秃头

近期在 Kaggle 的数据集中,我们发现了一个独特的秃头人像数据集,作者整理了 20 万张秃头人像,共计 1.3 G大小。

浅析人脸识别算法及其应用

人脸识别作为计算机视觉领域中时间最久远、应用最广泛的研究课题之一,近些年也在深度学习的加持下在性能方面获得了大幅提升,并在实际的生活场景中得到了广泛的应用。

超视频化到来,你能看见什么?

当人类优渥于一种状态,总有想象力冲破平衡。

ICCV 2021口罩人物身份鉴别全球挑战赛冠军方案分享

10月11-17日,万众期待的国际计算机视觉大会 ICCV 2021 (International Conference on Computer Vision) 在线上如期举行,受到全球计算机视觉领域研究者的广泛关注。今年阿里云多媒体 AI 团队(由阿里云视频云和达摩院视觉团队组成)参加了 MFR 口罩人物身份

《2021 年中国视频云场景应用洞察白皮书》联合首发!

该份白皮书洞悉产业的需求与供给,剖析视频云技术的关键环节,判断未来的发展趋向,而更核心的是,聚焦 5 大云上视频场景 —— 互联网泛娱乐、教育、传媒、平台电商化、协同办公,透析场景全链路需求,以多维度真实案例剖析盲点、痛点、机会点、创新点

四种 AI 技术方案,教你拥有自己的 Avatar 形象

随着元宇宙概念的大火,Avatar 这个词也开始越来越多出现在人们的视野。2009 年,一部由詹姆斯・卡梅隆执导 3D 科幻大片《阿凡达》让很多人认识了 Avatar 这个英语单词。不过,很多人并不知道这个单词并非导演杜撰的,而是来自梵文,是印度教中的一个重要术语

解码北京冬奥沉浸式报道黑科技: 阿里云视频云「互动虚拟演播技术」

这个冬奥季,即便你在冰雪之外,也能透过播报感受同在。这就是互动虚拟演播技术带来的。

ICASSP 2022 | 前沿音视频成果分享:基于可变形卷积的压缩视频质量增强网络

阿里云视频云视频编码与增强技术团队最新研究成果论文《基于可变形卷积的压缩视频质量增强网络》(Deformable Convolution Dense Network for Compressed Video Quality Enhancement)已被 ICASSP 2022 Image, Video & Multidimensional Signal Processing 主

带你读论文丨基于视觉匹配的自适应文本识别

​​摘要:ECCV2020 通过视觉匹配的方法来做文本识别,解决文档识别中的文本识别多样性和泛化性问题

计算机视觉常用图像数据集标记平台

在计算机视觉中海量图片数据的标记是个让人头疼的问题,通过学习总结列举以下几种常用的图像标记平台,从平台的价格、各种功能、工具和格式、项目管理和易用性等方面分析各个平台的特点,希望对小伙伴们有所帮助。

ICCV 2021口罩人物身份鉴别全球挑战赛冠军方案分享

10月11-17日,万众期待的国际计算机视觉大会 ICCV 2021 (International Conference on Computer Vision) 在线上如期举行,受到全球计算机视觉领域研究者的广泛关注。今年阿里云多媒体 AI 团队(由阿里云视频云和达摩院视觉团队组成)参加了 MFR 口罩人物身份

ICCV'21 | 论文速记 (Day 2)

主要记录关于视觉理解以及受限标签相关的论文。

技术解密 |阿里云多媒体 AI 团队拿下 CVPR2021 5 冠 1 亚成绩的技术分享

6 月 19-25 日,备受全球瞩目的国际顶级视觉会议 CVPR2021(Computer Vision and Pattern Recognition,即国际机器视觉与模式识别)在线上举行,但依然人气爆棚,参会者的激情正如夏日般火热。

直播时各种背景是怎么实现的?聊一聊虚拟背景背后的技术

2020 年一场突如其来的疫情闯进了我们的生活,上网课、在家办公逐渐成为了一种常态,为了更好地保护用户隐私、提升用户体验,各大在线办公软件相继推出了虚拟背景功能,营造学习、办公氛围的同时,又能避免家中环境不够正式的窘境。

直播时各种背景是怎么实现的?聊一聊虚拟背景背后的技术

2020 年一场突如其来的疫情闯进了我们的生活,上网课、在家办公逐渐成为了一种常态,为了更好地保护用户隐私、提升用户体验,各大在线办公软件相继推出了虚拟背景功能,营造学习、办公氛围的同时,又能避免家中环境不够正式的窘境。

专家解惑 | 关于华为云盘古大模型,你想问的都在这里~

​​摘要: 针对外界对盘古大模型充满了好奇,参与大模型开发的两位华为云专家来为大家答疑解惑。

技术解析 | 即构移动端超分辨率技术

即构超分追求:速度更快、效果更好、码率更低、机型更广。

PS 进行隐藏图制作

又到了喜闻乐见 悲痛欲绝的周日晚上了,明天又要开始上班了。

雾霾模糊?图像增强教你如何去雾

​​摘要:详细介绍图像去雾算法,经过图像增强后的图像也能应用于目标检测、图像分类或物联网检测等领域,并且效果更好。

视频云的全景蓝图,想象力的允诺之地

在过去,答案是肯定的。

工业机器视觉系统的构成与开发过程(理论篇—1)

在说到机器视觉系统时候,各位可能会对:机器视觉(machine vision)、图像处理(image processing)以及计算机视觉(computer vision)这三个概念感到困惑。

带你读论文丨基于视觉匹配的自适应文本识别

​​摘要:ECCV2020 通过视觉匹配的方法来做文本识别,解决文档识别中的文本识别多样性和泛化性问题

带你读论文丨基于视觉匹配的自适应文本识别

​​摘要:ECCV2020 通过视觉匹配的方法来做文本识别,解决文档识别中的文本识别多样性和泛化性问题

AI论文解读丨融合视觉、语义、关系多模态信息的文档版面分析架构VSR

​​​​​​摘要:文档版式分析任务中,文档的视觉信息、文本信息、各版式部件间的关系信息都对分析过程具有很重要的作用。本文提出一种融合视觉、文本、关系多模态信息的版式分析架构VSR。

AI论文解读丨融合视觉、语义、关系多模态信息的文档版面分析架构VSR

​​​​​​摘要:文档版式分析任务中,文档的视觉信息、文本信息、各版式部件间的关系信息都对分析过程具有很重要的作用。本文提出一种融合视觉、文本、关系多模态信息的版式分析架构VSR。

AI论文解读丨融合视觉、语义、关系多模态信息的文档版面分析架构VSR

​​​​​​摘要:文档版式分析任务中,文档的视觉信息、文本信息、各版式部件间的关系信息都对分析过程具有很重要的作用。本文提出一种融合视觉、文本、关系多模态信息的版式分析架构VSR。

论文解读丨无监督视觉表征学习的动量对比

摘要:本文提出了一个用于无监督视觉表征学习的动量对比方法(MoCo)。从将对比学习作为字典查询过程的角度来看,本文构建了一个由队列和移动平均编码器组成的动态字典。

论文解读丨无监督视觉表征学习的动量对比

摘要:本文提出了一个用于无监督视觉表征学习的动量对比方法(MoCo)。从将对比学习作为字典查询过程的角度来看,本文构建了一个由队列和移动平均编码器组成的动态字典。

论文解读丨无监督视觉表征学习的动量对比

摘要:本文提出了一个用于无监督视觉表征学习的动量对比方法(MoCo)。从将对比学习作为字典查询过程的角度来看,本文构建了一个由队列和移动平均编码器组成的动态字典。

论文解读丨无监督视觉表征学习的动量对比

摘要:本文提出了一个用于无监督视觉表征学习的动量对比方法(MoCo)。从将对比学习作为字典查询过程的角度来看,本文构建了一个由队列和移动平均编码器组成的动态字典。

论文解读丨无参数的注意力模块SimAm

摘要:本文提出了一个概念简单但对卷积神经网络非常有效的注意力模块。

论文解读丨无参数的注意力模块SimAm

摘要:本文提出了一个概念简单但对卷积神经网络非常有效的注意力模块。

其他标签