- 论文 2:OpenGAN: Open-Set Recognition via Open Data Generation
- 作者机构:卡内基梅隆大学
- 论文地址:https://arxiv.org/pdf/2104.02939.pdf
文章图片
论文摘要:真实世界的机器学习系统需要分析新的测试数据 , 而这些测试数据与训练数据不同 。 在 K-way 分类中 , 这被清晰地表述为开集识别 , 其核心是区分 K 个闭集类之外的开集数据的能力 。 关于开集的鉴别 , 有两种思想:1) 利用离群(outlier)数据作为开集 , 对开 - 闭(open-vs-closed)二进制鉴别器分别进行鉴别学习;2) 使用 GAN 对闭集数据分布进行无监督学习 , 并将其鉴别器作为开集似然函数 。 然而 , 前者不能很好地泛化到不同的开放测试数据 , 而后者由于 GAN 的训练不稳定效果不佳 。
该研究提出了 OpenGAN , 它通过将每种方法与几种技术见解相结合来解决每种方法的局限性 。 首先 , 他们展示了在一些真实的离群数据上 , 精心选择的 GAN 鉴别器已经达到了 SOTA 水平 。 其次 , 该研究用对抗性合成的假数据扩充可用的真实开集示例集 。 第三 , 也是最重要的 , 该研究在 K-way 网络计算的特征上可以构建鉴别器 。 大量实验表明 , OpenGAN 显著优于先前的开集方法 。
- 论文 3:Viewing Graph Solvability via Cycle Consistency
- 作者机构:特伦托大学等
- 论文地址:https://openaccess.thecvf.com/content/ICCV2021/papers/Arrigoni_Viewing_Graph_Solvability_via_Cycle_Consistency_ICCV_2021_paper.pdf
文章图片
论文摘要:在运动恢复结构(structure-from-motion , SFM)中 , 视图图(viewing graph)是一种顶点与相机对应、边代表基本矩阵的图 。 该研究提供了一种新的公式和算法 , 用于确定视图图是否可解(即它唯一地确定一组投影相机) 。 已知的理论条件要么不能完全描述所有视图图的可解性 , 要么涉及求解含大量未知数的多项式方程组而非常难以计算 。 该论文的主要成果是提出一种利用循环一致性来减少未知数的方法 。 该研究通过以下 3 种方法来进一步理解可解性:(i) 完成对最多 9 个节点的所有先前未定最小图的分类;(ii) 将实际可解性测试扩展到具有最多 90 个节点的最小图;(iii) 通过证明有限可解性不等于可解性明确回答了一个开放型研究问题 。 最后 , 该研究以一个真实数据的实验表明在实际情况中出现了无解的图 。
- 论文 4:Common Objects in 3D: Large-Scale Learning and Evaluation of Real-life 3D Category Reconstruction
- 作者机构:Facebook AI 研究院、伦敦大学学院
- 论文地址:https://arxiv.org/pdf/2109.00512.pdf
文章图片
论文摘要:由于缺乏真实的以类别为中心的 3D 标注数据 , 传统的 3D 物体类别学习方法 , 主要是在合成数据集上进行训练和评估 。 该研究的主要目标是通过收集与现有合成数据类似的真实世界数据来促进该领域的进展 。 因此 , 这项工作的主要贡献是一个名为「Common Objects in 3D」的大规模数据集 ,, 其中含有真实的多视角物体类别图像 , 并附有相机姿态和 3D 点云标注真值 。 该数据集包含来自近 19,000 个视频的 150 万帧捕获了 50 个 MS-COCO 类别的物体 , 因此它在类别和物体的数量方面都比其他数据集具有明显优势 。 研究者利用这个新数据集对几种新视图合成和以类别为中心的 3D 重建方法进行了大规模评估 。 此外 , 该研究还贡献了 NerFormer——一种新颖的神经渲染方法 , 利用强大的 Transformer 来重建仅给定少量视图的物体 。
特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
