HPC服务的使用以bwin为准 IT设施的使用条件 和其他适用的 它的政策.

所有用户必须同意遵守这些规则.

专门的HPC资源(Macleod)现在可用于教学和学习. 详情请见下文.
用于bwin的麦克斯韦星团
  1. 关于bwin的高性能计算
  2. 服务指南
  3. 什么是高性能计算?
  4. 技术规范
  5. 访问麦克斯韦
  6. 计算每个用户的资源和存储
  7. 备份和恢复
  8. 调度/优先级
  9. 可用性、维护和计划外中断
  10. 监控和仲裁

1. 关于bwin的高性能计算

高性能计算(高性能计算)是指将多台计算机的处理能力聚合在一起,为解决复杂的计算问题提供并行处理环境的一种实践, 通常比在单一设备上更快的时间尺度.

这所大学有自己的内部HPC集群,名为 麦克斯韦 后 詹姆斯·克拉克·麦克斯韦, 他是著名的苏格兰理论物理学家,曾在牛津大学的马里沙尔学院担任过几年教授.  所有教职员工和学生均可进入, 和外部合作者(通过PI), 以及外部组织.

内部的HPC基础设施是面向自助服务的. bwin代表所有用户维护硬件和软件, 但是人们期望用户能够理解如何使用软件并自己完成工作. 如果还没有安装所需的软件,用户可以请求安装.

2. 服务指南

有关以下服务信息,请参阅bwin麦克斯韦 HPC服务指南:

  • 请求过程
  • 特性
  • 用户(谁可以访问的详细信息)
  • 的服务水平
  • 支持和文档
  • 使用麦克斯韦的成本(成本并不总是适用)

3. 什么是高性能计算?

高性能计算包括使用许多计算机相互连接的集群——有时被称为超级计算机——来加速大型计算任务. HPC服务适用于解决需要相当大的计算能力或涉及大量数据的问题,这些数据通常需要在台式PC上分析几周或几个月, 如果能做到的话. HPC集群可以连续几天提供超过1000台桌面计算机的资源, 单台台式电脑一天就能完成一年的工作.

高性能计算集群已经被广泛的学科和bwin主题的学校的bwin人员使用.g., 基因组测序与分析, 化学途径模拟, 气候变化影响评估和金融系统建模——并作为系统生物学等领域的校际和跨学科bwin的催化剂和促成因素.

如果您的bwin被计算资源所瓶颈, 高性能计算服务可以帮助改善分析和报告数据的时间, 执行由于资源限制而无法进行的分析.

4. 技术规范

麦克斯韦是一个Linux超级计算集群,位于Edward Wright数据中心,提供:

  • 1240 CPU核/ 10tb RAM
  • 一个非常高内存节点(3 TB):非常高内存节点的使用由数字bwin团队管理,以确保它被适当地使用.
  • 额外的高内存节点
  • 弹性高速网络包括100Gb/s InfiniBand互联,用于多节点MPI作业,10Gb到校园网络
  • 超过1拍字节的分级存储,包括15TB非常高性能的存储
  • 各种各样的商业和免费的hpc优化软件 看到当前列表
  • 用户开发的应用程序的编译器
  • 银河-访问银河服务器,利用高性能计算的资源. 这个开源, 基于网络的平台是为了让没有计算机编程经验的bwin人员能够访问计算生物学而设计的. 星系使用图形用户界面在集群的工作节点上运行软件 当前软件列表. 它允许工作流被保存和共享,支持可重现和透明的分析. bwin的bwin人员是银河训练网络的一部分, 谁在整个学年里举办银河专题研讨会.

你的要求超过了麦克斯韦尔的条件, bwin还可以提供对外部服务的访问,并可以就使用更大的HPC集群提供建议.

5. 访问麦克斯韦

可以使用各种支持SSH协议的客户机在校内和校外访问麦克斯韦. 这包括X Windows图形桌面和应用程序,以及用于文件传输的SCP.

  • 在校外接触麦克斯韦尔, 包括连接到Eduroam时, 通过大学的SSH跳转主机(SSH -gateway)支持。.
  • 对于那些已经熟悉访问Linux服务器的人, 您可以使用自己选择的SSH, 或SFTP / SCP软件.
  • 对于新手用户,bwin推荐使用X2Go(图形远程桌面)客户端, SSH访问工具为PuTTY,文件传输工具为WinSCP.
  • 该任务指导软件调测工程师在非Windows系统pc机上,通过预配置的PuTTY、X2Go客户端进行校外访问.
  • 另外,关于安装和配置客户端的手动说明,请参见 用户指南.

这些应用程式可透过软件中心自动安装在大学的Windows电脑上,也可免费下载,以供自己的电脑使用.

通过星系可以从校园网内访问网络.

其中几种访问方法需要修改配置才能在非大学计算机上使用. 有关安装软件和连接麦克斯韦的详细信息,请参阅bwin的 用户指南.

请与数码服务小组联络 digitalresearch@freewso.net 为进一步支持.

6. 计算每个用户的资源和存储

计算

  • 根据可用性,一次最多可访问200个作业插槽/CPU内核. 这可以通过安排来增加.
  • 能够运行RAM分配高达200GB的作业

存储

  • 50GB弹性备份个人家庭空间.
  • 同时为用户分配1TB的暂存空间作为工作存储.
  • 通过协商可以获得额外的保险库存储. 库促进了在麦克斯韦上的长期存储,并减轻了对正在进行的项目从其他非hpc存储位置拉出数据的需要. 当项目需要在一段时间内重复使用相同的数据时,它非常有用.

7. 备份和恢复

存储 HPC备份和恢复策略
家里的空间 数据备份方式如下:
  • Daily backups kept for 14 days<
  • 每周备份1周
文件恢复方式如下:
  • 到文件夹/文件的路径,或者
  • 到另一个指定的HPC文件路径,或
  • 到指定的共享驱动器
请求过程:
共享的划痕 没有备份
没有备份

8. 调度/优先级

集群运行Slurm工作负载管理器,自动将用户提交的作业分配到可用的计算节点上. 提供赠款或其他资金以支持麦克斯韦使用的项目在调度器上具有优先级.

  • 调度器在所有用户之间平衡插槽的可用性,以允许对系统的公平访问.
  • 它考虑每个工作的具体要求(e.g.、cpu数量、RAM数量、作业持续时间和节点关联需求)和优先级.
  • 当空间变得可用时,调度器启动排队作业,并可以设置为通过电子邮件通知用户作业状态.
  • 需要更多时间和资源的大型工作更难安排, 因此,确保所请求的资源尽可能准确对所有用户都有好处.
  • 较小的作业将被安排运行/回填到可用空间,因此可能比较大的作业更早开始/完成.

了解以下几点可以帮助用户在调度作业时提供准确的信息:

  • 当作业请求的内存不足时, 作业将无法运行, 并且将需要重新调度更多的内存请求.
  • 请求的内存比使用的内存多, 用户将拥有分配给他们的全部数量,因为该资源被阻塞,在其他地方不可用.
  • 任何作业的默认运行时间是24小时
    • 如果需要更多的时间,必须明确说明这一点.
    • 也可以要求更少的时间.
  • 分配给作业的时间不足时, 当分配的时间过去后,作业将停止,并且需要重新调度请求的时间.
  • 实际使用的时间小于请求的时间, 只有实际的时间将被归因于用户的帐户.
  • 交互式作业只能在请求的资源(e.g. cpu和内存)在麦克斯韦上立即可用.
  • 一旦调度完成,作业的数据就可以通过' squeue '命令从麦克斯韦获得. 它可以向用户提示正在运行的作业的状态或排队作业的优先级.

9. 可用性、维护和计划外中断

  • 麦克斯韦的设计目的是确保最大的可用性,并在某些核心或节点停止正常运行时继续运行. 当这种情况发生, 这些问题将得到解决, 尽可能, 不会对集群造成任何额外的干扰.
  • 计划的维护将提前通知所有用户,并将计划造成的破坏最小.
  • bwin将尽一切努力确保服务不会出现计划外的中断. 在事件, 无论是在HPC内部还是外部, 做造成破坏, 数字bwin将尽一切努力尽快恢复服务. 这可能涉及到与bwin的供应商合作.

10. 监控和仲裁

数字bwin服务团队负责监测系统的使用,应通过以下方式联系 digitalresearch@freewso.net 解决任何日程安排或优先级问题.

麦克劳德教与学群

该大学拥有自己的内部HPC集群(Macleod),专门用于教学和学习的资源,以提高上课时的可用性和性能.

该服务提供了大量的计算处理能力,所有大学教职员工和学生都可以使用.  工作人员可以要求访问教学 在这里.

什么是高性能计算?

高性能计算包括使用许多计算机相互连接的集群——有时被称为超级计算机——来加速大型计算任务. HPC服务适用于解决需要相当大的计算能力或涉及大量数据的问题,这些数据通常需要在台式PC上分析几周或几个月, 如果能做到的话.

HPC集群已经被许多不同学科的学校的一些工作人员所使用, 供bwin及教学之用, e.g., 基因组测序与分析, 化学途径模拟, 气候变化影响评估和金融系统建模——并作为系统生物学等领域的校际和跨学科bwin的催化剂和促成因素.

技术规范

Macleod是一个位于Edward Wright数据中心的Linux超级计算集群,提供:

  • 120个CPU核和1个.2TB RAM—每个节点最少256GB
  • 专家节点:2个节点,每个节点配置3xA100 GPU卡,提供21个GPU分区
  • 高速网络——10Gb网络
  • 超过50TB的scratch存储
  • 各种各样的商业和免费的hpc优化 软件
  • 用户开发的应用程序的编译器
  • 星系  
    • 访问使用高性能计算资源的银河服务器. 这个开源, 基于网络的平台是为了让没有计算机编程经验的bwin人员能够访问计算生物学而设计的.
    • 星系使用图形用户界面在集群的工作节点上运行软件. 它允许工作流被保存和共享,支持可重现和透明的分析.
    • bwin的bwin人员是银河训练网络的一部分, 谁在整个学年里举办银河专题研讨会.

当要求超出Macleod所提供的,并涉及到一个bwin项目的交付, 请查看可用的资源 麦克斯韦, HPC用于bwin.

进一步的信息

如有疑问,请联系 digitalresearch@freewso.net

外部资源

你的前沿/新颖的bwin问题超出了麦克斯韦高性能计算的能力,你需要更多的计算能力吗? bwin可以提供访问更强大和更专业的HPC e.g. 基于GPU的HPC. 他们将有你需要的优势来实现你的bwin目标. bwin将为您访问这些二级(区域级)HPC资源提供便利. 它们都有自己的接入成本和条件.

访问以下二级HPC:

用他们丰富的记忆, 这些高性能计算允许您同时运行内存密集型的多核和单核问题. 这些高性能计算的用户友好的“批量”环境为用户提供了高质量的生活服务, 允许它们对计算作业进行排队,而无需进一步的交互.

如果你认为你的计算需求可能会让麦克斯韦尔屈服, 然后请bwinbwin可以看到关于让你访问外部HPC资源.

常见问题解答
高性能计算对我有用吗?

如果您的bwin需要处理大量数据和/或您当前处理的数据需要数周/数月在个人电脑上处理, 您很有可能会从使用新的机构HPC服务中受益.

谁会用麦克斯韦?

所有需要使用高性能计算服务的工作人员和bwin人员都将有机会这样做.

bwinbwin生应该通过他们的bwin顾问在第一个实例中展示商业案例.

谁支持麦克斯韦尔?

bwin专门的数字bwin基础设施支持团队将为bwin人员提供集群的使用建议, 作业和与作业要求相关的任何软件的调度. 与数字bwin服务团队联系 digitalresearch@freewso.net

第三方供应商对HPC系统的安装和维护经验丰富,提供24/7的硬件和软件管理以及麦克斯韦用户的监控和支持.

我如何访问HPC服务?

如欲使用麦克斯韦(bwin项目),请填写申请表格 在这里.

如欲使用麦克劳德(教学用),请填写申请表格 在这里.

注册后,您将收到有关访问服务的进一步指导. 你也可以看到bwin 用户指南 为进一步的信息.

我能在校外访问麦克斯韦尔吗?

是的. 门户访问也可从校外的任何PC与互联网连接, 包括个人台式电脑或笔记本电脑. 看到bwin用户指南 更多的.

我可以从我的个人设备访问HPCC吗?

是的, 任何个人桌面或笔记本电脑都可以通过门户或VPN访问集群.

我可以更改我的密码吗?

密码可以通过修改IT账户密码的标准路径进行修改. 提醒用户麦克斯韦的密码不是特定于集群的.

提供什么软件?

bwin提供广泛的商业和免费的高性能计算优化软件-参见 最新详情列表.

bwin也提供一系列的软件银河看到 最新详情列表.

是否可以向集群中添加软件?

是的,任何需要在麦克斯韦油井上运行的特定软件包的要求都将在内部进行审查,并由支持承包商添加. bwin预计大多数软件需求将能够安装在集群上, 然而,用户将负责任何商业软件所需的许可.

鼓励用户确保将所需的软件加载到共享存储库中以便重用. 它还可以在一个全国性的数据库中共享,供其他机构使用. 数字bwin服务团队将建议您如何做到这一点.

我怎么承认使用了麦克斯韦?

bwin建议如下:

作者感谢bwin资助的麦克斯韦计算集群的支持."

当我的bwin数据不在HPCC上使用时,我可以在哪里存储它,它是否安全?

资讯科技服务为大学提供和管理一个弹性网络数据存储解决方案,该解决方案持续复制到一个灾难恢复站点,并在夜间进行备份. 这个系统是分层的,为大学提供短期和长期的存储设施, 确保数据易于访问.

数据存储在安全的共享驱动器中,通常为团队、bwin基金等设置. 每个共享驱动器在团队中都有一个高级人员被提名为共享驱动器所有者. 这个人负责授权对共享驱动器的访问权限, 以及确保数据符合大学政策

存储我的bwin数据需要多少钱?

数据存储和附加文件共享服务的费用详见《bwin》.

www.abdn.ac.英国/ it /服务组合/ sc-pc-filestore.php