A Python and PyTorch developer, deep-learning worker and open-source activist.
Created by the awesome tool. 😊
- 📝 I regulary write articles on https://www.yuque.com/lart
- 💬 Ask me about Python, PyTorch in ISSUES
- ⚡ Fun fact I am a boy.
- 神经网络基础 | 给定条件下推导对应的卷积层参数 - Mon, 20 Jan 2025: 本文讨论了给定条件下卷积层参数的推导和代码。
- Transformer | 相对位置编码 - Sun, 19 Jan 2025: 相对位置编码现在已经被很多的视觉Transformer使用,也存在不同的实现形式。由于位置编码的本质就是将可学习变量或者是固定参数与特定的位置索引关联起来,所以实现的过程中会涉及到大量的坐标索引的变换,可读性很差。也因此不同形式的实现也存在着明显的差异。
- Hausdorff 距离 - Sat, 18 Jan 2025: 本文的内容主要围绕目标定位经典工作LocatingObjectsWithoutBoundingBoxes展开,着重于介绍HausdorffDistance相关的知识。
- Neuromorphic Computing | 基础知识 - Wed, 15 Jan 2025: 我们可以用充电、放电、重置,这 3 个离散方程来描述任意的离散脉冲神经元。
- ICLR 2024 - Spike-driven Transformer V2 - Meta Spiking Neural Network Architecture Inspiring the Des - Fri, 16 Aug 2024: 具体来说,本文将 NeurIPS 2023 发表的第一版工作中的脉冲驱动的 Transformer 扩展为元架构,并探索了结构、脉冲驱动自注意力和跳跃连接对其性能的影响。
- ArXiv 2405 | Rethinking Scanning Strategies with Vision Mamba in SemSeg of Remote Sensing Imagery - Fri, 17 May 2024: 这项研究对主流扫描方向及其组合对遥感图像语义分割的影响进行了全面的实验研究。通过在 LoveDA,ISPRS Potsdam 和 ISPRS Vaihingen 数据集上进行的广泛实验,我们证明,无论其复杂性或所涉及的扫描方向数量如何,都没有单一的扫描策略能胜过其他扫描策略。简单的单个扫描方向被认为足以对高分辨率遥感图像进行语义分割。 还建议了未来研究的相关方向。
- ICLR 2024 | FasterViT: Fast Vision Transformers with Hierarchical Attention - Fri, 17 May 2024: 本文提出了一种 CNN 和 ViT 的混合架构,即 FasterViT。这样的混合架构可以快速生成高质量 token,然后基于 Transformer 块来进一步处理这些 token。其重点在于结合架构组合和高效的注意力模块的设计,从而优化 ViT 模型的计算效率,提高图像的吞吐率,加强对于高分辨率图像的适应能力。
- ICCV 2021 | FcaNet: Frequency Channel Attention Networks 中的频率分析 - Sat, 27 Apr 2024: 文章是围绕 2D 的 DCT 进行展开的,本文针对具体的计算逻辑进行梳理和解析。
- CVPR 2024 - Rethinking the Evaluation Protocol of Domain Generalization - Sun, 14 Apr 2024: 这篇文章主要讨论了领域泛化评估协议的重新思考,特别是如何处理可能存在的测试数据信息泄露风险。作者首先指出,当前的领域泛化评估协议可能存在问题,可能导致测试数据信息泄露,进而影响评估的公平性和准确性。作者还根据这些建议重新评估了十个代表性的领域泛化算法,并提供了三个新的测试leaderboard。这些更改和新的测试leaderboard的板将鼓励未来的研究,并促进领域泛化的更准确评估。
- CVPR 2024 | Efficient Deformable ConvNets: Rethinking Dynamic and Sparse Operator - Sun, 14 Apr 2024: 本文提出了高效的 DCNv4,这是一个专为视觉应用设计的高效有效的运算符。将 DCNv4 集成到其他现代骨干架构中,包括 ConvNeXt 和 ViT,替换深度可分离卷积和密集自注意力层。值得注意的是,在没有进行任何超参数调整的情况下,这些经过精心设计的网络在使用 DCNv4 时表现得相当出色,同时速度快得多,显示了动态、稀疏的 DCNv4 的有效性和效率。这些改进使得 DCNv4 与 DCNv3 相比显示出显著更快的收敛速度,并且处理速度大大提高,DCNv4 的速度提高了三倍以上。
View the archives @ csdn@p_lart.
Name | Stars | Description |
---|---|---|
Hands-on-Docker (中文) | 一份详尽的 Docker 使用指南。 | |
Awesome-Class-Activation-Map | An awesome list of papers and tools about the class activation map (CAM) technology. | |
PyTorchTricks | Some tricks of pytorch… | |
MethodsCmp | A Simple Toolkit for Counting the FLOPs/MACs, Parameters and FPS of Pytorch-based Methods. | |
PySODEvalToolkit | A Python-based salient object detection and video object segmentation evaluation toolbox. | |
PySODMetrics | A simple and efficient implementation of SOD metrcis. | |
PyLoss | Some loss functions for deeplearning. | |
OpticalFlowBasedVOS | A simple and efficient codebase for the optical flow based video object segmentation. | |
CoSaliencyProj | A project for co-saliency detection. Some codes are borrowed from ICNet. Thanks to ICNet Intra-saliency Correlation Network for Co-Saliency Detection (NIPS2020) | |
RunIt | A simple program scheduler for your code on different devices. | |
RegisterIt | Register it: A more flexible register for the DeepLearning project. | |
mssim.pytorch | A better pytorch-based implementation for the mean structural similarity. Differentiable simpler SSIM and MS-SSIM. | |
tta.pytorch | Test-Time Augmentation library for Pytorch. | |
YuQueTools | A simple tool to download your own articles from yuque. | |
ManageMyAttachments | Manage the attachments of your own obsidian vault. |