如何优雅地与HR谈薪?隐私比较算法了解一下

作者简介

刘毅恒

来自数据网格实验室BitXMesh团队一个鲜为人知的知名程序员

原标题:《优雅的求职——隐私比较算法实例》

背景介绍


我叫小明,是今年毕业的应届生。最近正忙于寻找一份工作,希望可以在这个竞争激烈的时代找到一个可以养活自己的办法。

今天就要去参加一个公司的面试了,通过我的重重努力,靠我朴素扎实的技术基础和出众的口才以及掩饰不了的耀眼的外貌,我成功地征服了前面几轮的面试官,今天这次是最后一面--HR面试。

我对自己很有信心,感觉应该可以成功通过面试,真正让我在意的,其实是这轮面试HR会和我谈及的薪资问题。

(明明是谁?原来是小明,神秘又可爱🐶

我去网上查了一下,这轮面试HR很可能会问我期望薪资是多少。我现在有点纠结,因为我不太了解他们平时会给到多少,说得太多了害怕他们对我印象不好直接把我刷了,说得低了的话……我室友王二麻子平时不太上课都拿到了一份工资不低的Offer。如果公司真的按照我的想法给我工资的话,根据低工资给我发Offer也太不甘心了,现在很纠结该如何与HR谈论薪资问题。

不过,我凭借着我海量的知识储备找到了一个很好的办法。

我记得我看过一篇博客,上面提到我国著名的图灵奖获得者姚期智院士曾经提出过一个百万富翁问题。两个富翁在一个会议上碰面了,因为闲得无聊所以就想比一比谁比较有钱,但是又不想让对方知道自己有多少钱,他提出了一种基于混淆电路的隐私比较大小做法。于是我灵光一现,这个事情和我遇到的困境非常相似,隐私比较大小就是解决问题的关键点


主体思路


我想到了一个很好的主意。

其实我要做的就是以我的期望薪资和他们愿意给我的薪资进行比较,只需要知道大小关系即可,我不用知道数字具体是多少。当然公司出于薪资保密相关的规章制度也不会直接告诉我的,同时我也不想让公司知道我的期望薪资数字。

这时,我可以准备十个文件夹,文件夹上面都写着一个价格范围,比如0-3k,3k-6k,6k-9k等等。然后我在文件夹里面塞上一个纸条,比如说我的期望薪资范围是6k-9k。

那么在写着0-3k和3k-6k的文件夹里面都塞入一个写着“老子不干了

”的字条,在6k-9k的文件夹里面塞入一个写着“🐢对绿豆,我们看对眼了”的字条,在其余的所有文件夹里面都塞入一个写着“我的能量超乎你想象,请务必收下我

”的字条。

只要公司取出他们计划薪资所对应的文件夹,就知道我的态度了(比如他们可以开出的薪资范围是9k-12k,那么他们只要取9k-12k的文件夹即可,然后打开文件夹看到里面的字条)。

可是,严谨如我,马上想到了存在的问题。如果公司HR在我面前取文件夹,那我就知道他们取的文件夹是哪一个,这就意味着我获知了公司可以开出的薪资范围是多少;又或者如果我把文件夹全都给公司HR,那HR就能偷偷打开所有的文件夹看到里面的内容,那我就没有隐私了。

聪明的我又想到了一个办法,不经意传输


不经意传输


不经意传输是一个传输协议,可以保证公司HR只能拿到他想要拿到的那个文件夹(也就是说他们能且只能读到一个文件夹里面字条的内容),而不被我知道他们具体拿了哪一个。

▲ 准备工作

为了实现不经意传输,我绞尽脑汁,总算是想到了一个方法。

作为一个非常在乎工资是多少的“土豪”

,我掏出了十部一模一样的全新的银色128g的iphone 12 pro,每个手机都只能用我的面容解锁。然后把之前要写在字条上的内容都写在备忘录里面,再在手机背面贴上小纸条,分别写着0-3k,3k-6k等等的价格范围。

▲ 实施阶段

我会把所有的手机都给HR,HR拿到十部手机之后,可以放在台子下面偷偷选择一个他们可以开出的工资所对应的手机,然后把其他的手机锁在他们自己的柜子里。因为所有的手机都只能用我的脸和密码才能完全解锁,所以这个时候HR手机里面的所有信息都没有办法获取。

HR会将手机背面写着价格范围的标签给撕掉,因为除了备忘录里的信息不一样,所有手机都是一模一样的,这个时候就算HR把手机拿在我面前晃,只要我不解锁看备忘录,就不太清楚HR具体拿了哪一部手机。

▲ 结果查看

最后我拿到该手机进行解锁,查看备忘录就可以获知他们可以开出的薪资是否符合我的心理预期。

这样就完成了整个比较大小的流程。


总结


在数据重要性日益凸显的今天,保证数据在保护隐私的情况下发挥其作用是国家统筹数据资源的一个重要前提。机构和个人对于数据隐私的敏感度越来越高,数据如何在保证隐私的前提下进行价值共享成为了人们最关注的问题,如果无法解决,那么数据便会成为个人的收藏品,沉淀在每个机构或个人的本地数据库内,无法发挥出其应有的价值,而多方安全计算技术正是解决这个难题的一个重要技术。

刚刚故事中的隐私比较大小算法也是多方安全计算的一个重要算法,它保护了个人的数据隐私(数据的值),但是最后又可以得到我们需要的结果(数据的大小关系)。

比较大小的过程,在实际生活中我们需要考虑的东西会更为复杂,因为如果比较两个千万级别的数字,要求比较精确度到个位数的话(即上述例子中字条上的范围就变成了一个数字)。那么需要准备的手机就太多了,需要准备1000万部手机,这个消耗无疑是非常大的。

实际案例中,我们通常遇到的问题就是非常现实的千万级别数据的比较

虽然上述故事中的方法是可行的,但随着大数据时代的不断发展,庞大数据量之间的比较场景随处可见。最典型的是智慧城市建设,需要多方海量数据进行统计,这不可能仅仅考虑结果的正确性和算法的隐私性,算法的性能也成为了一个至关重要的点。

如何突破性能的瓶颈,让各个隐私计算算法落到实处,实现真正的工业化实现也是我们正在不断追求的目标。


写评论,请先登录