关于互联网隐私和Google

11/04/2010

转: http://hi.baidu.com/aullik5/blog/item/de08a28a045d67739e2fb4c6.html

互联网时代隐私的矛盾
2010-04-06 14:42
前两天黑哥在blog上重点强调了一下这个问题:

http://hi.baidu.com/hi_heige/blog/item/e754ab132c5afec2c3fd789c.html

其中引用

方滨兴提的第二个建议就是慎用在线输入法。包括谷歌、搜狗在内的在线更新输 入法是可以泄密的。网民输入完以后,一个字、一个词、一句话都会被记录下来,尤其是常打的词、常用的词会更新上传给别人。这是一种变相的泄密渠道,会导致 自己信息的不安全。

其实这个问题,就是很典型的隐私问题,可以预见的未来,隐私问题将成为互联网关注的一个焦点。

互联网的出发点就是信息分享,分享的过程中,隐私信息也会随之流出,因为没有一个权威机构来界定哪些信息是隐私的,也没有规定互联网公司可以获取哪些信息,哪些不能获取;或者是相关的规定非常的少,少到这些规定远远无法覆盖海量信息的范围。

互联网改变生活,隐藏在这句话背后的意思,很大程度上就是:你做了什么,通过互联网都能让其他人知道。今天在互联网上,有太多的方式可以泄露隐私。在互联网上购物、注册各种报名单、聊天、交友、打游戏、收发邮件。到了今天,已经是Live on Internet。在互联网上的任何动作,都已经把这些信息传播出去。互联网公司因为获得了这些信息,故而能提供更好的服务,但这与人们保护隐私的需要存在矛盾之处。

为什么最近互联网公司都开始重视做输入法了?因为大家突然发现,在非拉丁语系国家里,原来输入法才是最重要的互联网入口。统治了输入法,就能知道用户到底在想什么,用户需要什么,从而可以为公司的发展战略提供有力的支持。

以淘宝为例子,前段时间淘宝开放了”数据魔方”,并承诺不会泄露用户的个人信息,只会提供一些具有统计意义的数据。但是在网络购物的过程中,淘宝是一定知道用户的隐私信息的。设想如下场景:

某个成人用品店的怪大叔老板购买了数据魔方服务,知道北京某个小区里年轻人特别多,他们精力旺盛,每个月都会在淘宝上消耗大量的TT,而且还知道他们钟爱什么牌子,哪种香型。于是怪大叔马上赶去这个小区开了家成人用品店。怪大叔的生意果然好了,他每天都会搬个小板凳坐在店门口,臆想着这些顾客,原来以前都是在淘宝上买TT的。

就这件事情而言,怪大叔能够知道该小区里的人是在淘宝上买TT,而不是在ebay上买TT的。这件事情算是泄露了隐私吗? 也许算,也许不算。 有的人会在乎,有的人不会,因为没有一个界定的标准。

但是事情还远不止于此。前面讲过,淘宝是知道这件事情的,甚至知道哪个具体用户,叫什么名字,住在什么地方,在何年何月在哪个店铺买了多少TT。虽然淘宝承诺不会泄露这条隐私,但他就是知道了。

这就涉及到另外一个问题,如果没有人工参与,而只有算法分析,那么是否会涉及到隐私问题。如果所有的敏感数据,都是由程序在跑,在内存中计算,永远不会有人工干预,永远不会记录到本地磁盘或者数据库里,最终的计算结果只具有统计学意义,而不会包含具体的数据,是否还存在隐私问题?

很遗憾,这个问题也没有明确的答案,但是,今天的互联网公司都是这么干的!而且有很多做的还很不到位,既无法保证不会有人工参与,也无法保证数据不会被记录到硬盘或者数据库里( 淘宝做的还是很好的 )。支付类网站由于要过PCI-DSS,尤其是国外的支付网站,所以有要求信用卡的CVV number是不能记录下来的,但也仅此而已。

抓取机器信息是否涉及到隐私问题?如果你安装的软件,把你电脑的所有信息都抓取了并发回去进行报告,你是否会恼怒?这些信息包括但不限于硬盘ID,网卡号,CPU ID,安装的软件列表。很遗憾,可能今天的大多数杀毒软件都这么做了。

在互联网时代,这些信息是互联网公司的命根子,他们依靠获取、加工、分享这些信息盈利。从某种意义上来说,这种对数据的分析,也使得互联网能更好的为人们服务。比如GMAIL里精准的做关联的索引,这种算法肯定是需要扫描所有的邮件内容,从而做出一些关联,虽然这个过程中不会有人工进行干预。但是邮件本来就是非常私密的东西,google是否有被授权以接触这些数据呢?很少有人去关心。

最近Google Buzz的隐私问题闹的沸沸扬扬,国外的安全社区也讨论过facebook, linkedin等网站因为隐私引起的一系列问题。这个领域充满了矛盾,一方面是如何保护人们的隐私,一方面则是互联网公司的盈利点、以及获取更多信息后所能带来的更优质服务的过程。现在相关法律和规定还非常欠缺,也许下个十年,这个矛盾会进一步激化,也会因此诞生出一些伟大的公司。

转: http://hi.baidu.com/hi_heige/blog/item/e754ab132c5afec2c3fd789c.html

或许现在已经是了,又漫长的谷歌退出中国的事件来看,GG的zf背景是很强大的,在国家诞生以来,有zf背景的一般是什么事情都做得出来的…

前段时间在大牛sowaht的blog上看到这样一篇文章:http://hi.baidu.com/secway/blog/item/4180703b0004d4e615cecbbd.html 引用彩色文字:

方滨兴提的第二个建议就是慎用在线输入法。包括谷歌、搜狗在内的在线更新输入法是可以泄密的。网民输入完以后,一个字、一个词、一句话都会被记录下来,尤其是常打的词、常用的词会更新上传给别人。这是一种变相的泄密渠道,会导致自己信息的不安全。

专家对一个输入法都表示可以泄密,那么GG的那些在线业务呢?GG翻译,gmail,GG文档等等,都是可以直接收集到GG帝国数据库里的…还有一直都有争议的GG地球[地图],黑客门常用的google-hack,那也只是冰山一小角了,一旦这个世界不在和平,那么GG帝国数据库将是最大的攻击武器…… 因为全世界都在用GG

update :http://cnbeta.com/articles/108066.htm

“另一方面,Chrome的Omnibox会将使用者的浏览资讯回传给Google,也引发不小疑虑。”

update 【2010年4月9日 11:36:49】

http://hi.baidu.com/xisigr/blog/item/59a815395ddbae28b9998ffd.html

There are 2 comments in this article:

  1. 11/04/2010孙悟空 say:

    接着你之前说过的问题,怎样保护互联网隐私,我觉得还有一点就是最好选个菜市场名做ID,比如你搜孙悟空,那么返回的基本都是西游记或者七龙珠的东东,
    当然,我试过Google自己,返回的信息还是让我浑身发凉,防不胜防啊,怕的……
    另外,类似Facebook、Twitter、人人网等站本身也支持站内寻人,所以也不能全怪Google~~

  2. 11/04/2010HONJAY say:

    哈哈,现在这时代,不是暴露不暴露的问题,是你暴露多少,以什么形式,在什么时候暴露而已,坦然面对就好,不被滥用就好。
    所以,我们的生活尽量不要被网络锁定。

Write a comment: