问:“是不是可以理解机器学习都是基于已有的数据进行概率统计学习,选择合适的模型?”
张夏天:可以这么认为。不过,我更认可的一种观点,不见得尽然对:机器学习是统计学发展到一定程度,无法解决大数据量的情况下做的一个妥协。在以往,对于很多问题都能够用概率的模型描述,或者概率密度函数,或者概率函数进行描述;但是发展到后来,我们发现在多维度,尤其高维度的情况下,用统计学不可能精确地求解或估计出这样的函数。机器学习就退而求其次,在分类问题上不要求精确到概率的结果,比如90%是A或者80%是B;机器学习需要的结果就是,要看到在某个空间里面,给出一个分类界面,指出结果是在哪边就OK了。
#搬砖#