广义线性模型?链接函数?sigmoid和softmax?Logistic处理多分类问题?logistic回归处理超大数据?使用logistic和randomsearch进行组合获取最优参数组合、优缺点
logistic regression是分类模型、不是回归模型。叫回归但不是回归,我们一起探究。
什么是广义线性模型?
广义线性模型和最小二乘回归均用于探究响应变量与一个或多个预测变量之间的关系。它们之间的实际区别在于广义线性模型技术通常与类别响应变量一起使用。最小二乘回归技术通常与连续响应变量一起使用。有关广义线性模型的详细描述。
广义线性模型技术和最小二乘回归技术均用于估计模型中的参数,从而优化模型的拟合。最小二乘回归可以最小化误差平方和,从而得到参数的极大似然估计。广义线性模型使用迭代重加权最小二乘算法来获得参数的极大似然估计值。
例如,您可以使用广义线性模型来研究机械师的经验年份(非负连续变量)与他们参与某个可选培训项目(一个二元变量:可为是或否)之间的关系,以预测他们的产品是否符合规格(一个二元变量:可为是或否)。前两个变量是预测变量,第三个变量是类别响应。
什么是链接函数?
广义线性模型包括可以将响应的预期值与模型中的线性预测变量相关联的链接函数。链接函数将类别响应变量水平的概率变换为无界限连续尺度。在变换完成之后,可以使用线性回归对预测变量和响应之间的关系进行建模。例如,二元响应变量可以有两个唯一值。将这些值转换为概率会使响应变量介于 0 和 1 之间。在向概率应用合适的链接函数时,所得到的值介于 −∞ 和 +∞ 之间。
广义线性模型?链接函数?sigmoid和softmax?Logistic处理多分类问题?logistic回归处理超大数据?使用logistic和randomsearch进行组合获取最优参数组合 优缺点