程序员采集100TB成人视频数据,开发原谅宝App

这两天程序员圈子里有一件广泛流传的事情,就是有个程序员从1024\91\sex8\PronHub这些网站采集了100TB的数据,采集完了之后他还做了一件事情,把这些视频拿去跟微博之类的社交媒体的头像做对比,识别出哪些妹子在这个数据库中。据说现在的有效识别率已经达到了99%了,不过这个数字大家看看就好了,我本人是肯定不相信这个准确率的。这件事情在微博一下子就炸开了,引起了广泛的讨论,有的人站这个开发者,有的人反对这个开发者。这两队人的态度都非常激烈。开发这个程序的开发者是这么描述他们的目的的:鉴于很多人都在说码农是各种退休小姐姐的接盘侠,我们为开发者朋友们做了一个筛选器。开发者的出发点是好的,但其实这样的东西落地可能会遇到各种各样的麻烦。我们先抛弃其他的东西先聊聊这件事情技术本身。这件事情光从「以图片搜视频」技术的角度来看可能并没有什么太大的难度,现在搜索引擎都有不少的以图搜图这样的技术,所以看这个软件光从图片搜索视频的角度来看有一定技术基础的。另外对于美颜、PS过的一些照片,据说现在的技术已经能做到还原了,但是这一段我没有经过非常详细的调查,想了解的可以继续深入一下。虽然从技术实现的角度来看好像是可行的,然而现状的复杂度其实是极高的,这种复杂度不仅仅是机器能理解的。前段时间有一个非常火的换脸工具叫做Deepfake,简单说就是利用深度学习的技术在收集到足够数据的情况下,能把一个视频中的某个人物的脸完全换成另一个人的脸。如果应用这样的技术,很容易可以把你P到一个色情视频中的主角,而你也会成为“受害者”。所以一旦类似原谅宝这样的工具上线,如何预防类似的诬陷换脸技术其实是个大问题。对于识别这种技术来说,有一定的误差率是可以容忍的,但是对于个体来说,一个误识别可能对一个人的负面影响可能非常大。如果技术上的问题都能解决,这个工具能够上线还有一道要过的关是法律和道德。法律这一块是否侵犯了公民的隐私这事情现在不好说,因为视频、头像确实都是公开信息。这个现在应该也没有非常针对性的条例出来,所以没法准确下结论。至于道德层面,应该是这款App被争论最多的地方。这件事情到底是否符合道德?我觉得这是一个玄学,每个人的道德准则是不一样的。我还跟小伙伴做了深入的探讨,得出的结论是:每个人的道德准则是不一样的,所以判断的标准也不一样,有的人觉得违反道德有的人觉得没有违反道德其实也是常态。没必要拿自己的价值观强加给别人。聊完这款App本身,我还想再聊聊这个App背后的东西。程序员作为老实人本体,有钱还找不到女朋友,成了很多人眼中的香饽饽。为此出现了一些诈骗团伙专门来欺骗这些高收入的程序员群体,有的是小打小闹仅仅是骗一些小钱,比方说卖茶的姑娘,这些赚了一票就会立马露馅的。类似卖茶姑娘这种其实还好了,而有的是放长线钓大鱼,通过聊天,以恋爱的名义获取信任,然后引诱你进入一些赌博、投资平台。通过前期投钱必赢的方式,勾引你投入大量的资金进一步上当,最后一下吃掉你的所有资产,然后所有的人都消失得无音无踪。而你可能还沉浸在人财双赢的快乐中。比引诱你赌博投资更狠的方法是不惜结婚的代价,从你身边捞走大量的财产,等你意识到的时候追悔莫及。但是这是极少数了。对于程序员来说,怎么尽可能的避免这种“被接盘”呢?其实就一条:对于来历不明的陌生人保持以戒心,这就能避免大多数情况下成为接盘侠的可能了。技术有朝一日能帮人识别那些明显的“坏人”,但是永远没法帮别人识别那些隐藏在好人中的“坏人”,请常常怀有警惕之心。。。。对了,刚刚查了一下原程序员博主已经把原谅宝相关的东西删除了,所以找是找不到相关的具体信息了,大家不要折腾着去找接口了!我倒是觉得把那100TB的数据做成以图搜片的产品,那么前景倒是一片光明呢。
发表评论 / Comment

用心评论~