14赞

Haskell的大规模设计？

作者：喜生-Da | 2023-07-07 12:52

如何解决《Haskell的大规模设计？》经验，为你挑选了7个好方法。

设计/构建大型功能程序的好方法是什么,特别是在Haskell中？

我已经阅读了很多教程(自己写一个方案是我最喜欢的,真实世界Haskell紧随其后) - 但大多数程序都相对较小,而且是单一目的.另外,我不认为它们中的一些特别优雅(例如,WYAS中的大量查找表).

我现在想要编写更大的程序,包含更多移动部件 - 从各种不同来源获取数据,清理数据,以各种方式处理数据,在用户界面中显示,持久化,通过网络进行通信等.一个最好的结构,这样的代码是易读,可维护,适应不断变化的要求？

有大量文献针对大型面向对象的命令式程序解决这些问题.像MVC,设计模式等的想法是实现广泛目标的理想规定,例如在OO风格中分离关注点和可重用性.此外,较新的命令式语言适合于"随着您的成长而设计"的重构风格,在我的新手看来,Haskell似乎不太适合.

Haskell有相同的文献吗？如何在功能性编程(单子,箭头,应用等)中使用异域控制结构的动物园最好地用于此目的？你能推荐什么最佳实践？

谢谢!

编辑(这是Don Stewart回答的后续行动):

@dons提到:"Monads在类型中捕获关键的建筑设计."

我想我的问题是:如何在纯函数式语言中考虑关键的架构设计？

考虑几个数据流的示例和几个处理步骤.我可以将数据流的模块化解析器编写为一组数据结构,我可以将每个处理步骤实现为纯函数.一个数据所需的处理步骤将取决于其值和其他数据.一些步骤之后应该是GUI更新或数据库查询等副作用.

什么是以正确方式绑定数据和解析步骤的"正确"方法？人们可以编写一个大功能,为各种数据类型做正确的事情.或者可以使用monad来跟踪到目前为止已处理的内容,并让每个处理步骤从monad状态获得接下来需要的任何内容.或者可以写很多单独的程序并发送消息(我不太喜欢这个选项).

他链接的幻灯片有一个我们需要的东西子弹:"将设计映射到类型/函数/类/ monad上的成语".什么是成语？:)

1> Don Stewart..：

我在Haskell的工程大项目以及XMonad的设计和实现中谈到了这一点.大型工程是关于管理复杂性.Haskell中用于管理复杂性的主要代码结构机制是:

类型系统

使用类型系统来强制执行抽象,简化交互.

通过类型强制实施关键不变量

(例如,某些值无法逃脱某些范围)

某些代码没有IO,不会触及磁盘

强制安全:检查异常(可能/可能),避免混合概念(Word,Int,Address)

良好的数据结构(如拉链)可以使某些类别的测试变得不必要,因为它们会静态地排除例如越界错误.

剖析器

提供程序的堆和时间配置文件的客观证据.

特别是堆分析是确保不使用不必要的内存的最佳方法.

纯度

通过删除状态显着降低复杂性.纯功能代码可以扩展,因为它是组合的.您需要的只是确定如何使用某些代码的类型 - 当您更改程序的其他部分时,它不会神秘地破坏.

使用大量的"模型/视图/控制器"样式编程:尽快将外部数据解析为纯函数数据结构,对这些结构进行操作,然后在完成所有工作后,渲染/刷新/序列化.保持大部分代码纯净

测试

QuickCheck + Haskell代码覆盖率,以确保您测试无法检查类型的内容.

GHC + RTS很适合看你是否花费太多时间做GC.

QuickCheck还可以帮助您为模块识别干净,正交的API.如果代码的属性很难说明,那么它们可能过于复杂.继续重构,直到你拥有一组可以测试代码的完整属性,这些属性组合得很好.那么代码也可能设计得很好.

Monads用于结构化

Monads以类型捕获关键架构设计(此代码访问硬件,此代码是单用户会话等)

例如,xmonad中的X monad,精确捕获了系统的哪些组件可见的状态设计.

键入类和存在类型

使用类型类来提供抽象:隐藏多态接口背后的实现.

并发和并行

潜入par您的计划,通过简单,可组合的并行性来击败竞争对手.

重构

你可以在Haskell中进行很多重构.如果您明智地使用类型,这些类型可确保您的大规模更改是安全的.这将有助于您的代码库扩展.确保重构会导致类型错误,直到完成.

明智地使用FFI

FFI使得更容易使用外部代码,但外国代码可能很危险.

关于返回的数据形状的假设要非常小心.

元编程

一些Template Haskell或泛型可以删除样板.

包装和分销

使用Cabal.不要滚动自己的构建系统.(编辑:其实你可能现在想要使用Stack开始.)

使用Haddock获得优秀的API文档

像graphmod这样的工具可以显示您的模块结构.

如果可能的话,依靠Haskell平台版本的库和工具.这是一个稳定的基地.(编辑:再次,这些天你可能想要使用Stack来获得稳定的基础并运行.)

警告

使用-Wall让您的代码更干净的气味.您还可以查看Agda,Isabelle或Catch以获得更多保证.对于类似lint的检查,请参阅伟大的hlint,它将提出改进建议.

使用所有这些工具,您可以处理复杂性,尽可能多地删除组件之间的交互.理想情况下,你有一个非常大的纯代码基础,它很容易维护,因为它是组合的.这并非总是可行,但值得瞄准.

通常:将系统的逻辑单元分解为可能的最小参考透明组件,然后在模块中实现它们.组件集(或组件内部)的全局或本地环境可能会映射到monad.使用代数数据类型来描述核心数据结构.广泛分享这些定义.

谢谢唐,你的答案非常好 - 这些都是有价值的指导方针,我会定期参考.我想我的问题在一个人需要这一切之前就已经迈出了一步.我真正想知道的是"将设计映射到类型/函数/类/ monad上的成语"......我可以尝试创建自己的,但我希望可以在某处提取一组最佳实践 - 或者如果没有,建议使用结构良好的代码来读取大型系统(而不是像一个专注的库).我编辑了我的帖子,更直接地提出同样的问题.

我在模块上添加了一些关于设计分解的文字.您的目标是将逻辑相关的功能识别为与系统的其他部分具有引用透明接口的模块,并尽可能快地使用纯功能数据类型来安全地建模外部世界.xmonad设计文档涵盖了很多内容:http://xmonad.wordpress.com/2009/09/09/the-design-and-implementation-of-xmonad/

我试图从Haskell*talk中的*Engineering Large Projects下载幻灯片,但链接似乎被打破了.这是一个有效的工作:http://www.galois.com/~dons/talks/dons-londonhug-decade.pdf

我设法找到了这个新的下载链接:http://pau-za.cz/data/2/sprava.pdf

@Heather即使我前面评论中提到的页面上的下载链接不起作用,看起来仍然可以在scribd上查看幻灯片:http://www.scribd.com/doc/19503176/The-Design - 和 - 推行 - 的-xmonad

2> user349653..：

Don给出了上面的大部分细节,但这是我在Haskell中执行系统守护进程等非常实用的有状态程序时的两分钱.

最后,你住在monad变换器堆栈中.最底层是IO.在此之上,每个主要模块(在抽象意义上,而不是文件中的模块意义)将其必要状态映射到该堆栈中的层.因此,如果您将数据库连接代码隐藏在模块中,则将其全部写入MonadReader类型连接m => ... - > m ...然后您的数据库函数始终可以获得其连接而无需其他函数模块必须意识到它的存在.您可能最终得到一个承载数据库连接的层,另一个配置,第三个用于解决并行和同步的各种信号量和mvars,另一个用于日志文件处理等.

首先找出你的错误处理.Haskell在大型系统中目前最大的弱点是过多的错误处理方法,包括像Maybe这样糟糕的错误处理方法(这是错误的,因为你不能返回任何关于出错的信息;总是使用Either而不是Maybe除非你真的只是意味着缺失值).弄清楚如何首先完成它,并从库和其他代码使用的各种错误处理机制中设置适配器到最后一个.这将为您节省一个悲伤的世界.

附录(摘自评论;感谢Lii和liminalisht) -
更多关于将大型程序分成堆栈中的monad的不同方法的讨论:

Ben Kolera为这个主题提供了一个很好的实用介绍,Brian Hurt讨论了将liftmonadic动作问题解决到你的自定义monad中的问题.George Wilson展示了如何使用mtl编写适用于任何实现所需类型类的monad的代码,而不是自定义monad类.Carlo Hamalainen撰写了一些简短有用的笔记,总结了乔治的演讲.

@Lii [Ben Kolera](https://www.youtube.com/watch?v=pzouxmWiemg)为这个主题提供了很好的实用介绍,[Brian Hurt](https://www.youtube.com/watch？ v = 8t8fjkISjus)讨论了将monadic动作提升到自定义monad问题的解决方案.[George Wilson](https://www.youtube.com/watch?v=GZPup5Iuaqw)展示了如何使用`mtl`编写适用于任何实现所需类型类的monad的代码,而不是自定义monad类.[Carlo Hamalainen](http://carlo-hamalainen.net/blog/2015/7/20/classy-mtl)撰写了一些简短有用的笔记,总结了乔治的演讲.

两个好点!这个答案的优点是具有合理的具体性,而其他的则不然.阅读有关将大型程序切割成堆栈中的monad的不同方法的更多讨论将会很有趣.如果您有任何内容,请发布此类文章的链接!

3> 小智..：

在Haskell中设计大型程序与在其他语言中进行设计没有什么不同.大型编程是将您的问题分解为可管理的部分,以及如何将这些部分组合在一起; 实现语言不太重要.

也就是说,在大型设计中,尝试利用类型系统以确保您只能以正确的方式将各个部分组合在一起是一件好事.这可能涉及newtype或phantom类型,以使看起来具有相同类型的东西不同.

当你进行重构代码时,纯度是一个很大的好处,所以尽量保持尽可能多的纯代码.纯代码很容易重构,因为它与程序的其他部分没有隐藏的交互.

我实际上发现,如果数据类型需要改变,重构是非常令人沮丧的.它需要繁琐地修改许多构造函数和模式匹配的arity.(我同意将纯函数重构为相同类型的其他纯函数很容易 - 只要不触及数据类型)

@Dan我的意思是如果你用任何语言改变一个函数的数据类型,你不是必须这样做吗？我不知道Java或C++等语言在这方面会如何帮助你.如果你说你可以使用两种类型服从的某种通用接口,那么你应该在Haskell中使用Typeclasses.

@semicon Java等语言的差异在于存在成熟,经过良好测试和全自动化的重构工具.通常这些工具具有出色的编辑器集成,并且带走了与重构相关的大量繁琐工作.Haskell为我们提供了一个出色的类型系统,用于检测重构中必须更改的内容,但实际执行重构的工具(目前)非常有限,特别是与Java中已有的相比生态系统超过10年.

@Dan使用记录时,您可以通过较小的更改(例如添加字段)完全免费.有些人可能想要记录习惯(我是其中之一^^").

4> comonad..：

我本书第一次学习了结构化函数式编程.它可能不是您正在寻找的,但对于函数式编程的初学者来说,这可能是学习构建函数式程序的最佳第一步 - 与规模无关.在所有抽象级别上,设计应始终具有明确排列的结构.

功能编程工艺

http://www.cs.kent.ac.uk/people/staff/sjt/craft2e/

与FP的Craft一样伟大 - 我从中学习了Haskell - 它是*初学者程序员*的*介绍性文本*,而不是Haskell中大型系统的设计.

嗯,这是我所知道的关于设计API和隐藏实现细节的最好的书.通过本书,我成为了C++中更好的程序员 - 只是因为我学会了更好的组织代码的方法.好吧,你的经验(和答案)肯定比这本书好,但Dan可能仍然是Haskell的_beginner_.(``beginner = do write $ tutorials \`about \`Monads`)

5> graninas..：

我目前正在写一本名为"功能设计与架构"的书.它为您提供了一套完整的技术,如何使用纯函数方法构建大型应用程序.它描述了许多功能模式和想法,同时构建了类似SCADA的应用程序'Andromeda',用于从头开始控制太空飞船.我的主要语言是Haskell.这本书包括:

使用图表进行体系结构建模的方法;

需求分析;

嵌入式DSL域建模;

外部DSL设计和实现;

Monads作为具有效果的子系统;

免费monad作为功能接口;

箭头化的eDSL;

使用自由monadic eDSL进行控制反转;

软件交易记忆;

镜头;

国家,读者,作家,RWS,ST monads;

不纯的状态:IORef,MVar,STM;

多线程和并发域建模;

GUI;

主流技术和方法的适用性,如UML,SOLID,GRASP;

与不纯子系统的交互.

你可能熟悉这本书的代码在这里,和"仙女"项目代码.

我希望在2017年年底完成这本书在此之前,你可以阅读我的文章"函数式编程设计与建筑"(RUS)这里.

UPDATE

我在网上分享了我的书(前5章).请参阅Reddit上的帖子

当然!现在我完成了一半的文本,但这是整体工作的1/3.所以,保持你的兴趣,这激励了我很多!

嗨!我在网上分享了我的书(前5章).请参阅Reddit上的帖子:https://www.reddit.com/r/haskell/comments/6ck72h/functional_design_and_architecture/

6> Rehno Lindeq..：

Gabriel的博客文章可扩展程序架构可能值得一提.

Haskell设计模式与主流设计模式的区别在于一个重要方面:

传统架构:将A类的几个组件组合在一起,生成B类"网络"或"拓扑"

Haskell架构:将A类的几个组件组合在一起,生成相同类型A的新组件,其特征与其取代部分无法区分

通常情况下,一种看似优雅的建筑往往会从图书馆中脱颖而出,这种图书馆以自下而上的方式展现出这种良好的同质感.在Haskell中,这一点尤其明显 - 传统上被认为是"自上而下的架构"的模式往往会被捕获在像mvc,Netwire和Cloud Haskell这样的库中.也就是说,我希望这个答案不会被解释为尝试取代这个线程中的任何其他人,只是结构选择可以并且应该理想地由域专家在库中抽象出来.在我看来,构建大型系统的真正困难在于评估这些图书馆的建筑"善"与所有实际问题.

正如liminalisht在评论中提到的那样,类别设计模式是Gabriel关于该主题的另一篇文章,类似地.

我想提一下Gabriel Gonzalez关于[类别设计模式]的另一篇文章(http://www.haskellforall.com/2012/08/the-category-design-pattern.html).他的基本论点是,我们的功能程序员认为"良好的架构"实际上是"组合架构" - 它使用保证编写的项目来设计程序.由于类别法保证在组合下保留身份和关联性,因此通过使用我们具有类别的抽象来实现组合架构 - 例如纯函数,monadic动作,管道等.

7> haroldcarr..：

我发现亚历杭德罗·塞拉诺的文章" 使用Haskell教学软件架构 "(pdf)对于思考Haskell中的大规模结构非常有用.

Haskell的大规模设计？

C#ColorMatrix索引超出界限

如何在Java中读取相同的文件两次？

使用随机访问迭代器调用模板函数

检查值是否在一系列数字之间

使用量角器验证文本的一部分

php5升级后安装php mongo驱动程序时出错

在朱莉娅变量中的数组结束

反应路由器链接参数.意外的字符'''.在uglify和eslint中

CSS/LESS:Calc()使用百分比减去未正确评估的像素

Django 1.9:Field与父模型中不存在的字段的字段冲突

Robolectric:在我的案例中运行处理程序的looper

如何从MVEL表达式中调用外部方法？

实体框架7 RC1关系

取消Ajax请求或取最后一个请求

在定义路由指令时是否可以使用隐式参数？

在seaborn Pairgrid中绘制下三角形

为Android Studio创建自定义模板

使用另一个自定义服务的服务时,没有提供商...错误

使用Python的Spark:将RDD输出保存到文本文件中

在chrome dev工具中加载单独的源图文件