Bootstrap
ICCV 2021口罩人物身份鉴别全球挑战赛冠军方案分享

10月11-17日,万众期待的国际计算机视觉大会 ICCV 2021 (International Conference on Computer Vision) 在线上如期举行,受到全球计算机视觉领域研究者的广泛关注。今年阿里云多媒体 AI 团队(由阿里云视频云和达摩院视觉团队组成)参加了 MFR 口罩人物身份

ICCV'21 | 论文速记 (Day 2)

主要记录关于视觉理解以及受限标签相关的论文。

ICCV'21 | 论文速记 (Day 1)

主要记录关于视觉理解以及受限标签相关的论文。

技术解析 | 即构移动端超分辨率技术

即构超分追求:速度更快、效果更好、码率更低、机型更广。

技术解密 |阿里云多媒体 AI 团队拿下 CVPR2021 5 冠 1 亚成绩的技术分享

6 月 19-25 日,备受全球瞩目的国际顶级视觉会议 CVPR2021(Computer Vision and Pattern Recognition,即国际机器视觉与模式识别)在线上举行,但依然人气爆棚,参会者的激情正如夏日般火热。

直播时各种背景是怎么实现的?聊一聊虚拟背景背后的技术

2020 年一场突如其来的疫情闯进了我们的生活,上网课、在家办公逐渐成为了一种常态,为了更好地保护用户隐私、提升用户体验,各大在线办公软件相继推出了虚拟背景功能,营造学习、办公氛围的同时,又能避免家中环境不够正式的窘境。

直播时各种背景是怎么实现的?聊一聊虚拟背景背后的技术

2020 年一场突如其来的疫情闯进了我们的生活,上网课、在家办公逐渐成为了一种常态,为了更好地保护用户隐私、提升用户体验,各大在线办公软件相继推出了虚拟背景功能,营造学习、办公氛围的同时,又能避免家中环境不够正式的窘境。

专家解惑 | 关于华为云盘古大模型,你想问的都在这里~

​​摘要: 针对外界对盘古大模型充满了好奇,参与大模型开发的两位华为云专家来为大家答疑解惑。

PS 进行隐藏图制作

又到了喜闻乐见 悲痛欲绝的周日晚上了,明天又要开始上班了。

雾霾模糊?图像增强教你如何去雾

​​摘要:详细介绍图像去雾算法,经过图像增强后的图像也能应用于目标检测、图像分类或物联网检测等领域,并且效果更好。

视频云的全景蓝图,想象力的允诺之地

在过去,答案是肯定的。

工业机器视觉系统的构成与开发过程(理论篇—1)

在说到机器视觉系统时候,各位可能会对:机器视觉(machine vision)、图像处理(image processing)以及计算机视觉(computer vision)这三个概念感到困惑。

带你读论文丨基于视觉匹配的自适应文本识别

​​摘要:ECCV2020 通过视觉匹配的方法来做文本识别,解决文档识别中的文本识别多样性和泛化性问题

带你读论文丨基于视觉匹配的自适应文本识别

​​摘要:ECCV2020 通过视觉匹配的方法来做文本识别,解决文档识别中的文本识别多样性和泛化性问题

AI论文解读丨融合视觉、语义、关系多模态信息的文档版面分析架构VSR

​​​​​​摘要:文档版式分析任务中,文档的视觉信息、文本信息、各版式部件间的关系信息都对分析过程具有很重要的作用。本文提出一种融合视觉、文本、关系多模态信息的版式分析架构VSR。

AI论文解读丨融合视觉、语义、关系多模态信息的文档版面分析架构VSR

​​​​​​摘要:文档版式分析任务中,文档的视觉信息、文本信息、各版式部件间的关系信息都对分析过程具有很重要的作用。本文提出一种融合视觉、文本、关系多模态信息的版式分析架构VSR。

AI论文解读丨融合视觉、语义、关系多模态信息的文档版面分析架构VSR

​​​​​​摘要:文档版式分析任务中,文档的视觉信息、文本信息、各版式部件间的关系信息都对分析过程具有很重要的作用。本文提出一种融合视觉、文本、关系多模态信息的版式分析架构VSR。

论文解读丨无监督视觉表征学习的动量对比

摘要:本文提出了一个用于无监督视觉表征学习的动量对比方法(MoCo)。从将对比学习作为字典查询过程的角度来看,本文构建了一个由队列和移动平均编码器组成的动态字典。

论文解读丨无监督视觉表征学习的动量对比

摘要:本文提出了一个用于无监督视觉表征学习的动量对比方法(MoCo)。从将对比学习作为字典查询过程的角度来看,本文构建了一个由队列和移动平均编码器组成的动态字典。

论文解读丨无监督视觉表征学习的动量对比

摘要:本文提出了一个用于无监督视觉表征学习的动量对比方法(MoCo)。从将对比学习作为字典查询过程的角度来看,本文构建了一个由队列和移动平均编码器组成的动态字典。

论文解读丨无监督视觉表征学习的动量对比

摘要:本文提出了一个用于无监督视觉表征学习的动量对比方法(MoCo)。从将对比学习作为字典查询过程的角度来看,本文构建了一个由队列和移动平均编码器组成的动态字典。

论文解读丨无参数的注意力模块SimAm

摘要:本文提出了一个概念简单但对卷积神经网络非常有效的注意力模块。

论文解读丨无参数的注意力模块SimAm

摘要:本文提出了一个概念简单但对卷积神经网络非常有效的注意力模块。

论文解读丨无参数的注意力模块SimAm

摘要:本文提出了一个概念简单但对卷积神经网络非常有效的注意力模块。

真的!只需 “六步” 实现图像特定物体识别!!!

基于OpenCV实现图像特定物体的识别,将图像识别的技术总结为关键六个步骤,并根据光伏组件串案例提供完整代码。

微软亚研院:如何看待计算机视觉未来的走向?

计算机视觉有一种未来走向是:“借用”人类视觉的特点,设计模型。

OpenCV 在 Android 上的应用

本文介绍了 OpenCV 及其在 Android 上的配置,以及在 Android 上使用的两则实例。

华为云的研究成果又双叒叕被MICCAI收录了!

摘要:2020年国际医学图像计算和计算机辅助干预会议(MICCAI 2020),论文接收结果已经公布:华为云医疗AI团队和华中科技大学合作的2篇研究成果入选。

浅析人脸识别算法及其应用

人脸识别作为计算机视觉领域中时间最久远、应用最广泛的研究课题之一,近些年也在深度学习的加持下在性能方面获得了大幅提升,并在实际的生活场景中得到了广泛的应用。

CVPR 2020 六小时教程上线!新视角生成的前沿方法

作为计算机视觉领域的全球三大顶会之一,CVPR 每年吸引着众多专业人士参加,CVPR 2020 更是迎来了投稿量过万的盛况。近日,CVPR 2020 会议在线上召开,近 30 个教程已上线,一起来云参会吧。

没想到【成功的计算机视觉应用】居然是这样部署的!

随着现有图像数据量的增长以及人工智能 (AI) 对全球企业重要性的日益增强,#计算机视觉#正在一些行业快速发展。计算机视觉是机器学习 (ML) 的一种形式,它帮助计算机“看到”与人眼所见类似的图像,并对图像进行标注。通过对图像和其中的对象进行分类,计算机

视频云大赛|视频目标分割,下一个视频算法技术爆发点?

近年来随着智能移动终端和互联网的快速发展,视频数据呈现指数级增长。视频目标分割拥有众多的消费落地场景,特别是最近火爆的视频会议、视频直播、短视频制作等场景中的应用极为广泛,因此如何为用户打造更智能、更优质、更沉浸的体验,实现对视频中兴趣对象

ICASSP 2022 | 前沿音视频成果分享:基于可变形卷积的压缩视频质量增强网络

阿里云视频云视频编码与增强技术团队最新研究成果论文《基于可变形卷积的压缩视频质量增强网络》(Deformable Convolution Dense Network for Compressed Video Quality Enhancement)已被 ICASSP 2022 Image, Video & Multidimensional Signal Processing 主

这个 “少年黑客”,用黑科技守护独居老人

2021 年 2 月,“新内容 新交互” 全球视频云创新挑战赛启幕。本次大赛由英特尔联合阿里云主办,与优酷战略技术合作,天池平台和阿里云视频云团队共同承办。大赛自开赛以来,吸引了全球超过 4600 名选手报名参赛,我们遴选了参赛选手中优秀案例和动人故事,一

未来直播 “神器”,像素级视频分割是如何实现的 | CVPR 冠军技术解读

被誉为计算机视觉领域 “奥斯卡” 的 CVPR 刚刚落下帷幕,2021 年首届 “新内容 新交互” 全球视频云创新挑战赛正火热进行中,这两场大赛都不约而同地将关注点放在了视频目标分割领域,本文将详细分享来自阿里达摩院的团队在 CVPR DAVIS 视频目标分割比赛夺冠

其他标签