如何创建一个简单的Gradient Descent算法

作者：手机用户2402851335 | 2023-06-28 16:40

如何解决《如何创建一个简单的GradientDescent算法》经验，为你挑选了1个好方法。

我正在研究简单的机器学习算法,从简单的梯度下降开始,但是我在尝试在python中实现它时遇到了一些麻烦.

这是我试图重现的例子,我有关于房屋的数据(生活区域(以英尺2为单位)和卧室数量),结果价格如下:

居住面积(2英尺):2104

#bedrooms:3

价格(1000 $ s):400

我正在尝试使用梯度下降法进行简单的回归,但我的算法不起作用......算法的形式不是故意使用向量(我试图逐步理解它).

i = 1
import sys
derror=sys.maxint
error = 0
step = 0.0001
dthresh = 0.1
import random

theta1 = random.random()
theta2 = random.random()
theta0 = random.random()
while derror>dthresh:
    diff = 400 - theta0 - 2104 * theta1 - 3 * theta2
    theta0 = theta0 + step * diff * 1
    theta1 = theta1 + step * diff * 2104
    theta2 = theta2 + step * diff * 3
    hserror = diff**2/2
    derror = abs(error - hserror)
    error = hserror
    print 'iteration : %d, error : %s' % (i, error)
    i+=1

我理解数学,我正在用$ x_1 $构建一个预测函数 $$ h _ {\ theta}(x)=\theta_0 +\theta_1 x_1 +\theta_2 x_2 $$ http://mathurl.com/hoy7ege.png http://mathurl.com/2ga69bb.png和$ x_2 $ http://mathurl.com/2cbdldp.png是变量(居住面积,卧室数量)和$ h _ {\ theta}(x)$ http: //mathurl.com/jckw8ke.png估计价格.

我正在使用成本函数($ hserror $ http://mathurl.com/guuqjv5.png)(一分): $$ hserror =\frac {1} {2}(h _ {\ theta}(x) - y)^ 2 $$ http://mathurl.com/hnrqtkf.png 这是一个常见的问题,但我更像是一名软件工程师而且我一步一步学习,你能告诉我什么是错的？

我得到了这个代码:

data = {(2104, 3) : 400, (1600,3) : 330, (2400, 3) : 369, (1416, 2) : 232, (3000, 4) : 540}
for x in range(10):
    i = 1
    import sys
    derror=sys.maxint
    error = 0
    step = 0.00000001
    dthresh = 0.0000000001
    import random

    theta1 = random.random()*100
    theta2 = random.random()*100
    theta0 = random.random()*100
    while derror>dthresh:
        diff = 400 - (theta0 + 2104 * theta1 + 3 * theta2)
        theta0 = theta0 + step * diff * 1
        theta1 = theta1 + step * diff * 2104
        theta2 = theta2 + step * diff * 3
        hserror = diff**2/2
        derror = abs(error - hserror)
        error = hserror
        #print 'iteration : %d, error : %s, derror : %s' % (i, error, derror)
        i+=1
    print ' theta0 : %f, theta1 : %f, theta2 : %f' % (theta0, theta1, theta2)
    print ' done : %f' %(theta0 + 2104 * theta1 + 3*theta2)

最终得到这样的答案:

 theta0 : 48.412337, theta1 : 0.094492, theta2 : 50.925579
 done : 400.000043
 theta0 : 0.574007, theta1 : 0.185363, theta2 : 3.140553
 done : 400.000042
 theta0 : 28.588457, theta1 : 0.041746, theta2 : 94.525769
 done : 400.000043
 theta0 : 42.240593, theta1 : 0.096398, theta2 : 51.645989
 done : 400.000043
 theta0 : 98.452431, theta1 : 0.136432, theta2 : 4.831866
 done : 400.000043
 theta0 : 18.022160, theta1 : 0.148059, theta2 : 23.487524
 done : 400.000043
 theta0 : 39.461977, theta1 : 0.097899, theta2 : 51.519412
 done : 400.000042
 theta0 : 40.979868, theta1 : 0.040312, theta2 : 91.401406
 done : 400.000043
 theta0 : 15.466259, theta1 : 0.111276, theta2 : 50.136221
 done : 400.000043
 theta0 : 72.380926, theta1 : 0.013814, theta2 : 99.517853
 done : 400.000043

Michael Ande.. 8

第一个问题是,只使用一个数据来运行它会给你一个欠定系统...这意味着它可能有无数个解决方案.有三个变量,您希望至少有3个数据点,最好是更高.

其次使用梯度下降,其中步长是梯度的缩放版本,除了在解的小邻域之外不保证收敛.你可以通过切换到负梯度(慢)方向的固定大小步骤或负梯度方向的linesearch(更快,但稍微复杂)来解决这个问题.

所以对于固定步长而不是

theta0 = theta0 - step * dEdtheta0
theta1 = theta1 - step * dEdtheta1
theta2 = theta2 - step * dEdtheta2

你做这个

n = max( [ dEdtheta1, dEdtheta1, dEdtheta2 ] )    
theta0 = theta0 - step * dEdtheta0 / n
theta1 = theta1 - step * dEdtheta1 / n
theta2 = theta2 - step * dEdtheta2 / n

看起来您的步骤中可能还有一个符号错误.

我也不确定恐怖是一个很好的停止标准.(但是停止标准是非常难以"正确")

我的最后一点是,参数拟合的梯度下降速度非常慢.您可能希望使用共轭梯度或Levenberg-Marquadt方法.我怀疑这两种方法在numpy或scipy包中已经存在python(默认情况下它们不是python的一部分,但很容易安装)

1> Michael Ande..：

第一个问题是,只使用一个数据来运行它会给你一个欠定系统...这意味着它可能有无数个解决方案.有三个变量,您希望至少有3个数据点,最好是更高.

所以对于固定步长而不是

theta0 = theta0 - step * dEdtheta0
theta1 = theta1 - step * dEdtheta1
theta2 = theta2 - step * dEdtheta2

你做这个

n = max( [ dEdtheta1, dEdtheta1, dEdtheta2 ] )    
theta0 = theta0 - step * dEdtheta0 / n
theta1 = theta1 - step * dEdtheta1 / n
theta2 = theta2 - step * dEdtheta2 / n

看起来您的步骤中可能还有一个符号错误.

我也不确定恐怖是一个很好的停止标准.(但是停止标准是非常难以"正确")

推荐阅读

程序员
javax.el.ELException:无法将类型为java.lang.String的2015-12-03 18:50转换为类java.util.Date？

如何解决《javax.el.ELException:无法将类型为java.lang.String的2015-12-0318:50转换为类java.util.Date？》经验，为你挑选了1个好方法。 ... [详细]
程序员
我应该如何在Akka持久性中构造持久性参与者？

如何解决《我应该如何在Akka持久性中构造持久性参与者？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何获取uinput创建的设备的名称(路径)

如何解决《如何获取uinput创建的设备的名称(路径)》经验，为你挑选了1个好方法。 ... [详细]
程序员
getline()带有文件描述符而不是文件指针

如何解决《getline()带有文件描述符而不是文件指针》经验，为你挑选了1个好方法。 ... [详细]
程序员
在OpenCV中逐像素复制图像

如何解决《在OpenCV中逐像素复制图像》经验，为你挑选了1个好方法。 ... [详细]
程序员
告诉Volley不要使用缓存数据,而是发起新请求？

如何解决《告诉Volley不要使用缓存数据,而是发起新请求？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何检查符号链接是否存在,无论它指向何处

如何解决《如何检查符号链接是否存在,无论它指向何处》经验，为你挑选了1个好方法。 ... [详细]
程序员
从文件中删除一行

如何解决《从文件中删除一行》经验，为你挑选了1个好方法。 ... [详细]
程序员
Android上是否有任何类型的粒子发射器,如iOS CAEmitterLayer用于圆形发射器？

如何解决《Android上是否有任何类型的粒子发射器,如iOSCAEmitterLayer用于圆形发射器？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在ASP.NET MVC 5中使用带有razor语法的jquery？

如何解决《如何在ASP.NETMVC5中使用带有razor语法的jquery？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何使用runhaskell取消隐藏ghc库

如何解决《如何使用runhaskell取消隐藏ghc库》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否可以在rmarkdown呈现的pdf文档中包含svg图像？

如何解决《是否可以在rmarkdown呈现的pdf文档中包含svg图像？》经验，为你挑选了0个好方法。 ... [详细]
程序员
无法建立搅拌机

如何解决《无法建立搅拌机》经验，为你挑选了0个好方法。 ... [详细]
程序员
在django-import-export中导入m2m关系

如何解决《在django-import-export中导入m2m关系》经验，为你挑选了1个好方法。 ... [详细]
程序员
Lodash过滤器和功能组合

如何解决《Lodash过滤器和功能组合》经验，为你挑选了1个好方法。 ... [详细]
程序员
在宏变量名称SAS中解析包含%eval的宏

如何解决《在宏变量名称SAS中解析包含%eval的宏》经验，为你挑选了1个好方法。 ... [详细]
程序员
C++模板专业化和继承

如何解决《C++模板专业化和继承》经验，为你挑选了1个好方法。 ... [详细]
程序员
IntelliJ正在生成私有的getter

如何解决《IntelliJ正在生成私有的getter》经验，为你挑选了1个好方法。 ... [详细]
程序员
webpack插件中的流水线代码生成

如何解决《webpack插件中的流水线代码生成》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何动态设置TableLayoutPanel中的单元格颜色？

如何解决《如何动态设置TableLayoutPanel中的单元格颜色？》经验，为你挑选了1个好方法。 ... [详细]

手机用户2402851335

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章