Lesson1 介绍

例子:点击“垃圾邮件”按钮过滤垃圾邮件，这里的E：找出那些是垃圾还不是垃圾的邮件的工作.T:完成过滤垃圾邮件的工作。P:是否是垃圾邮件的概率

两种算法

分别是监督学习和非监督学习。监督学习，就是我们指定策略让计算机去执行；而非监督学习是让计算机自己去学习如何分析。

给定一组数据集，我们给出针对每一个数据给出正确的表现,通过预测接下来的结果。这种方式是监督学习，因为数据是有标签的。

在机器学习中可能会有基于多个attribute也就是属性进行预测的方式。例如癌症和肿块的大小以及年龄的大小，两个属性来进行预测。可能有些时候，你想要使用的是无穷多个数据维度进行分析和预测。

这里讨论两种方式，分别是回归还是分类。回归就是得到连续的结果；而分类得到的是离散的。

聚类，通过对一组数据的分析和分组，找出共性，然后进行分类。这是聚类算法。在股票方便的研究，我在想，可以分出强势股，弱势股等。

例如：新闻分类，基因组分类，计算机集群分类（将相互协作的计算机放在一起),客户数据分析，天文数据分析（例如星系诞生）。

通过鸡尾酒宴会算法来进行语音识别与分析。通过将宴会上两个人通过两个麦克风的录制声音，能够通过非监督学习，将背景和人的声音分离开来。

鸡尾酒算法使用了SVD。

Octave 作为机器学习的原型开发会更加快速，更加方便。开发出原型之后，再转换成java, C, python等语言。