2016年1月26日星期二

种族的性质对于群体性格有着重大影响

深得我心。盎格鲁萨克逊人的个人主义,罗马人的规则之上却不时表露出的暴民和血液质,东日耳曼人的国家主义,以及东方的专制主义。民族不是在选择政治形态,政治形态只是这个民族的群体意识的外在表现。

有些理论和实践上不好的制度反而适合一些民族。共产专制以寡头领导和一党独裁为其框架,在中国带来8000万人死亡的悲剧,创造了前无古人后无来者的专制制度,,但是其本质不过是中国历代专制王朝的延续。

如果说实践是检验真理的唯一标准,那么以历朝历代中国没有跳出东方式专制王朝的囹圄这一事实来看,中国的大多数人是适合接受专制统治的。他们害怕自由制度下的选择胜过害怕专制制度下的迫害。他们利用规则而不是打破规则,但同时又蔑视与自己无关的规则。他们有着盲目的集体主义,又同时有着极端的利己主义。他们面对强权时极度懦弱,面对弱者时极度残忍。他们有着极易煽动的国家主义,却又在国家利益和个人利益中往往选择后者。他们狡诈而聪明,却又在行动前欠缺考虑。

我们往往夸大教育的作用,认为教育可以塑造公民,但实际上教育只能赋予你以知识;我们总是夸大洗脑的作用,认为洗脑造就屁民,但是洗脑对于很多人而言并无功用。最为愚蠢的人都会发现洗脑书本中文字的荒唐可笑。决定一个人的政治信仰的除基因外别无他物。洗脑教育的成功不过是教育内容非常好地契合了中国人的大脑结构。如果让一个生来对于专制制度深信不疑的人试读自由主义著作,那么他会认为这些思想极度可笑。

总之,在上述品质中,我认为并没有一条足以列进公民所需素质清单中。思来想去,越觉得蒙古人和满清屠城对于这个民族人种选择作用之大。有些民族生而腐败,而在此之上若加入逆淘汰之因素,那么结果只能是悲剧。

思路比较乱,先写这么多,之后有空整理

2015年12月7日星期一

PCA(主成份分析)

简单回顾一下,给自己做个备忘 

目的在于将具有多维属性的数据集进行降维。将n个属性维度映射到k维上(n>k)。在降噪(信号传输),数据挖掘等领域都有应用。 

简单来说,就是给定一个训练集,有n个样本,和a个属性,构成一个n×a的矩阵M。将此训练集中的全部数值都减去期望值(平均值)得到矩阵R。求出M的协方差矩阵k个最大特征值所对应的特征向量矩阵A(k是任选的,对应你结果想要的维数)。再用R×A,得到最终的降维矩阵。 这样得到的矩阵可以保证在每一维度上方差最大。证明要用数学公式,编辑太麻烦,故略。

详见http://www.cnblogs.com/jerrylead/archive/2011/04/18/2020209.html




2015年11月28日星期六

罗马,日本与中国皇帝的一点比较

就算是如卡利古拉,图密善,卡拉卡拉之流的暴君,杀人数仍不可望朱元璋,唐太宗一类的中国所谓明君之项背。
日本平安时代,武家尚未夺取政权,但是天皇仍无一位似中国皇帝残暴多杀。

2015年11月22日星期日

一个有趣的历史事实

布鲁图(Lucius Junius Brutus)推翻小塔克文,结束王政时代;同一家族的Marcus Junius Brutus和Decimus Junius Brutus Albinus参与刺杀凯撒。这个家族以另一种方式左右了罗马的历史进程

Balance 算法

详见《mining of massive data sets》 8.4.4
对贪心算法的改进,其竞争率为3/4。

将查询分配给出价最高且剩余预算最多的广告商。如果多个广告商的剩余预算相等,则随意选择一个。



2015年11月18日星期三

马基雅维利一句经常被引用错误的名言

“目的证明手段正确”。

若读《论李维罗马史》,会发现这句话有一个前提,那就是目的必须正当。

共产主义者普遍信奉这句话,有两个原因:
 1.不知道它的前提,因而信奉。
 2.自认为目的正确,因而信奉。

可见这句话无论有没有前提,都害人不浅。波普尔说过,进行总括性的历史预言超出科学方法范围之外。要是以此预言为目的进行大规模社会实验就更是灭绝人性的罪恶和愚蠢。

BFR算法

聚类算法的一种。
  寻找初始点方式:
   (1)选择彼此距离尽可能远的点。
   (2)先进行聚类,输出k个簇,再在每个簇中选择一个点。

假设簇满足以质心为期望的正态分布。按上述方式选择初始的k个点。
之后,数据文件中的点按照组块方式读入。
目前内存中有:
    1.组块
    2.废弃集
    3.压缩集
    4.留存集


后三者关系如图:


下面开始数据处理。

  (1)首先,充分接近某个簇质心的点会被加到该簇中。
  (2)对于不充分接近簇质心的点,同留存集中的点一起聚类。
  (3)压缩集迷你簇和新的迷你簇(迷你簇含有互相接近,但是不接近于任何簇的点)之间可以进行合并。
  (4)不在留存集中的点,也就是一个簇或者迷你簇中的点,会和分配结果一起写到二级存储上。


注意一点,上述操作在每个组块输入后都会进行一次。
当组块输入完成后,会对压缩集和留存集进行操作。具体因需要而异,也可能不进行任何操作。

如何将某点p分给某个簇?
计算p和这个簇质心的马氏距离,选择质心具有最短马氏距离的簇,如果距离小于某个阀值,将p加入簇中。