2012後半

2nd, Jul. デジタル文献整理の技法 １．文献の分類 ２．文献メモの添附と整理

3rd, Jul. Some funds for supporting the venture company. http://www.kickstarter.com/ http://www.edgeweb.jp/

11th, Jul. 今日にサイバー大学の先生と食事する時、日本でこういう大学があるのと初めて聞いた. その先生の話によると、遠隔演習システムを作ってみたいようになりました.

23th, Jul. 非 监 督的学 习 的主要功能就是：聚 类 ，降 维 ，推理，估 计 分布等，所以 纯 粹的非 监 督学 习 是不能做 classifcation的，如果你的数据全都是未 标记 的，那只能完成聚 类这 一步. 如果你 连 cluster 的个数也不知道的 话 ，那么可以用 Dirichlet Process 的方法，不 过这 是非 监 <span style="font-family: 'ＭＳ 明朝','serif';">督学 习 <span style="font-family: 'ＭＳ 明朝','serif';">里面很高 级 <span style="font-family: 'ＭＳ 明朝','serif';">的一个主 题 <span style="font-family: 'ＭＳ 明朝','serif';">了，如果你有 兴 <span style="font-family: 'ＭＳ 明朝','serif';">趣的 话 <span style="font-family: 'ＭＳ 明朝','serif';">可以参看以下 论 <span style="font-family: 'ＭＳ 明朝','serif';">文： Dirichlet_Process_teh_yee_whye.pdf //<span style="font-family: 'Century','serif';">(142.31 KB, ////<span style="font-family: 'ＭＳ 明朝','serif';">下 //// 载 ////<span style="font-family: 'ＭＳ 明朝','serif';">次数 ////<span style="font-family: 'Century','serif';">: 59) //

<span style="font-family: 'ＭＳ 明朝','serif';">最后的准确率受很多因素影响，但是最主要的是 feature selection, <span style="font-family: 'ＭＳ 明朝','serif';">就是 说 <span style="font-family: 'ＭＳ 明朝','serif';">如何 选 <span style="font-family: 'ＭＳ 明朝','serif';">取最具有代表力的 feature(<span style="font-family: 'ＭＳ 明朝','serif';">准确的 说应该 <span style="font-family: 'ＭＳ 明朝','serif';">是 feature with highest distinguish capacity), <span style="font-family: 'ＭＳ 明朝','serif';">如果你的 feature 选 <span style="font-family: 'ＭＳ 明朝','serif';">的好的 话 <span style="font-family: 'ＭＳ 明朝','serif';">，那么聚 类 <span style="font-family: 'ＭＳ 明朝','serif';">效果将比 较 <span style="font-family: 'ＭＳ 明朝','serif';">好，从而最后的 classification<span style="font-family: 'ＭＳ 明朝','serif';">也将很好

对 <span style="font-family: 'ＭＳ 明朝','serif';">于聚 类 <span style="font-family: 'ＭＳ 明朝','serif';">之后怎么 办 <span style="font-family: 'ＭＳ 明朝','serif';">， 这 <span style="font-family: 'ＭＳ 明朝','serif';">就涉及到半 监 <span style="font-family: 'ＭＳ 明朝','serif';">督的机器学 习 <span style="font-family: 'ＭＳ 明朝','serif';">了. 举 <span style="font-family: 'ＭＳ 明朝','serif';">个同上面的人 脸识别 <span style="font-family: 'ＭＳ 明朝','serif';">例子，我 们 <span style="font-family: 'ＭＳ 明朝','serif';">可以通 过现 <span style="font-family: 'ＭＳ 明朝','serif';">有成熟的有 监 <span style="font-family: 'ＭＳ 明朝','serif';">督的机器学 习 <span style="font-family: 'ＭＳ 明朝','serif';">的方法（如 SVM<span style="font-family: 'ＭＳ 明朝','serif';">） 进 <span style="font-family: 'ＭＳ 明朝','serif';">行 训练 <span style="font-family: 'ＭＳ 明朝','serif';">，但是需要有 10000<span style="font-family: 'ＭＳ 明朝','serif';">个 训练样 <span style="font-family: 'ＭＳ 明朝','serif';">本才能取得 较 <span style="font-family: 'ＭＳ 明朝','serif';">好 结 <span style="font-family: 'ＭＳ 明朝','serif';">果，但是手工去 标记 10000 张图 <span style="font-family: 'ＭＳ 明朝','serif';">片将很 费时 <span style="font-family: 'ＭＳ 明朝','serif';">（如果 训练样 <span style="font-family: 'ＭＳ 明朝','serif';">本更多将更 严 <span style="font-family: 'ＭＳ 明朝','serif';">重）. 所以可以先随机手工 标记 100 张 <span style="font-family: 'ＭＳ 明朝','serif';">，然后放回 训练样 <span style="font-family: 'ＭＳ 明朝','serif';">本中，然后 对 <span style="font-family: 'ＭＳ 明朝','serif';">所有 训练样 <span style="font-family: 'ＭＳ 明朝','serif';">本 进 <span style="font-family: 'ＭＳ 明朝','serif';">行聚 类 <span style="font-family: 'ＭＳ 明朝','serif';">（ k=2), 这样 <span style="font-family: 'ＭＳ 明朝','serif';">就能得到两个 clusters<span style="font-family: 'ＭＳ 明朝','serif';">，再 计 <span style="font-family: 'ＭＳ 明朝','serif';">算两个 cluster<span style="font-family: 'ＭＳ 明朝','serif';">中已 标记样 <span style="font-family: 'ＭＳ 明朝','serif';">本中人 脸 <span style="font-family: 'ＭＳ 明朝','serif';">和非人 脸 <span style="font-family: 'ＭＳ 明朝','serif';">的比例， 选 <span style="font-family: 'ＭＳ 明朝','serif';">取比例高的作 为 cluster<span style="font-family: 'ＭＳ 明朝','serif';">的 标记 <span style="font-family: 'ＭＳ 明朝','serif';">， 这 <span style="font-family: 'ＭＳ 明朝','serif';">里如果比例相差不是很大的 话 <span style="font-family: 'ＭＳ 明朝','serif';">就重新聚 类 <span style="font-family: 'ＭＳ 明朝','serif';">知道找到一种聚 类 <span style="font-family: 'ＭＳ 明朝','serif';">方式能 够 <span style="font-family: 'ＭＳ 明朝','serif';">使其中 cluster<span style="font-family: 'ＭＳ 明朝','serif';">中大部分是人 脸 <span style="font-family: 'ＭＳ 明朝','serif';">，而另外一个 cluster<span style="font-family: 'ＭＳ 明朝','serif';">大部分是非人 脸 <span style="font-family: 'ＭＳ 明朝','serif';">. 这样 <span style="font-family: 'ＭＳ 明朝','serif';">就可以通 过 100<span style="font-family: 'ＭＳ 明朝','serif';">个手工 标记 <span style="font-family: 'ＭＳ 明朝','serif';">的 图 <span style="font-family: 'ＭＳ 明朝','serif';">像区自 动标记 10000<span style="font-family: 'ＭＳ 明朝','serif';">各 图 <span style="font-family: 'ＭＳ 明朝','serif';">像. 再用 SVM<span style="font-family: 'ＭＳ 明朝','serif';">或者其他 supervised learning <span style="font-family: 'ＭＳ 明朝','serif';">方法就很 简单 <span style="font-family: 'ＭＳ 明朝','serif';">了.

<span style="font-family: 'ＭＳ 明朝','serif';">15th, Sep. <span style="font-family: 'ＭＳ 明朝','serif';">OpenFlow, a protocol can be used to experiment the new routing protocol on the real network.