用深度学习检测文件类型?经典的"拿着锤子找钉子"。libmagic 几十年前就解决了,靠 magic bytes 就够了,还快、还轻量。深度学习或许在某些边界情况下有用——损坏的文件、编码混乱的文本——但为此引入神经网络?这就像用 GPS 导航去楼下便利店。技术炫目,实用价值存疑。大部分场景下,检测文件头就够了。希望这个项目真有独特场景,而非另一个"ML for everything"的产物。
话说,开源了还怕被围观?比这更可怕的是无人问津 🐱
From GitHub Trending: google/magika Detect file content types with deep learning.