Human Pose Estimation Literature Review

【导读】:本综述将会以时间顺序总结一些基于 Deep Learning 的人体姿态估计 (Human Pose Estimation) 有代表意义的论文。这些文章最早从 Google 提出的 DeepPose 开始,代表了 Pose Estimation 领域的发展。

2D Human Pose Estimation

What is Human Pose Estimation?

  • Human Pose Estimation 主要是在图像或视频中检测估计人体的一些关键点(例如,关节,五官等)的问题。它也可以被定义成在所有关节姿势的空间中搜索特定姿势的问题。
  • 2D Pose Estimation - 从图像中估计2D姿态(关键点)坐标,即 2D pose (x,y) coordinates。
  • 3D Pose Estimation - 估计出关键点的3D坐标,即Estimate a 3D pose (x,y,z) coordinates a RGB image.

2D (keypoints input) to 3D pose estimation example

  • 3D mesh (shap) estimation - 从图像中估计object的shape,例如数据集DensePose

DensePose Results: 3D shape estimation


DenseNet — Dense卷积网络(图像分类)

【导读】本文对Dense卷积网络的发展进行了综述。这是2017年的CVPR最佳论文奖,并拥有2000多篇论文引用。它由康威尔大学、清华大学和facebook AI共同合作完成。

作者 | Sik-Ho Tsang (原文:Review: DenseNet — Dense Convolutional Network (Image Classification))
编译 | Xiaowen


DeepMedic - multi-sacle 3D CNN with CRF for brain lesion segmentation

论文阅读笔记,如果我有什么理解错误的地方,欢迎大家指正。
论文:Efficient multi-scale 3D CNN with fully connected CRF for accurate brain lesion segmentation

摘要:作者提出一种双路径,11层深的3D卷积神经网络用于brain lesion segmentation任务,主要解决了医学图像处理上的三个方面的问题。一是作者设计了一种dense training scheme的方案,采用全卷积神经网络,一次把相邻像素的image segments传入网络输出dense prediction (dense-inference),从而节省了计算代价。作者使用更深的网络使模型判别能力更强。作者使用一种dual pathway architecture,即同时训练两个网络,使模型同时对高/低分辨率图像进行处理。最后作者采用全连接条件随机场(Fully connected Conditional Random Field)对网络output进行后处理(post-processing)改善图像类之间的边缘信息。

1. Dense Training

在传统patch-wise的分类中,输入patch的尺寸和cnn最后一层神经元的感受野大小相同,这样网络得到一个single prediction对应输入patch的中心像素的值。而用全卷积实现的神经网络,因为其输入的patch的尺寸可以大于最后一层神经元的感受野,因此模型可以同时输出多个prediction,即dense-inference,而每一个prediction对应cnn’s receptive field的在输入patch上的每一步stride。


Fig.2. Our baseline CNN consists of four layers with $5^3$ kernels for feature extraction, leading to a receptive field of size $17^3$. The classification layer is implemented as convolutional with $1^3$ kernels, which enables efficient dense-inference. When the network segments an input it predicts multiple voxels simultaneously, one for each shift of its receptive field over the input. Number of FMs and their size depicted as (Number × Size).


OpenCV - Python api 笔记

Opencv-python是OpenCv的python API,包括数百种计算机视觉算法。这个页面记录了一些常用的Opencv-python函数,以便作为我的快速参考。

1. 安装和使用 Installation and Usage

  • 安装
1
pip install opencv-python

事实上一共有四种不同的packages,安装其中一个即可,四个packages都用同一个名字cv2(对于其他的packages,详见Documentation)。

2. OpenCV中的GUI特性

2.1 图像基本操作(读取,显示,保存)

三个函数cv.imread(), cv.imshow(), cv.imwrite()分别用于读取;显示和保存图像。


Your browser is out-of-date!

Update your browser to view this website correctly.&npsb;Update my browser now

×