服务¶
记录实验室服务器提供的全部服务。
- 魔法网络:请参考 使用说明。
- 节点监控:https://grafana.lab.tiankaima.cn:8443/
占用情况:https://git.lug.ustc.edu.cn/-/snippets/349
DNS¶
*.lab.tiankaima.cn:这里应该包含所有对外提供服务(HTTP(S)、代理等)的 URL。*.s.tiankaima.dev:包含了一些服务器的A&AAAA记录,这样其他服务只需要使用CNAME就可以同时对外以IPv4&IPv6提供服务。
Caddy (cls1-gateway/jp-2)¶
| ~/.bashrc | |
|---|---|
| /srv/docker/caddy/docker-compose.yml | |
|---|---|
- HTTP 不直接走
:80。 - HTTPS 不直接走
:443。 - 证书通过 DNS challenge 签发。
| /srv/docker/caddy/docker-compose.yml | |
|---|---|
常用操作¶
维护测试¶
可临时取消下面这行注释,本地改 /etc/hosts 指向内网地址即可访问。
LLDAP (jp-2)¶
Headscale (jp-2)¶
| ~/.bashrc | |
|---|---|
| /srv/docker/headscale/conf/derp.yaml | |
|---|---|
DERP (cls1-gateway)¶
headscale-ui (jp-2)¶
Web 控制面板:https://headscale.lab.tiankaima.cn/web/
Tailscale 接入¶
在 lab 用户下生成 preauth key:
| /srv/network/tailscale.sh | |
|---|---|
systemd-nspawn (cls1-gateway)¶
cls1-gateway 上运行了名为 login 的 systemd-nspawn 容器,用于提供登录环境。
- 容器根目录:
/var/lib/machines/login - 容器配置:
/etc/systemd/nspawn/login.nspawn - systemd 单元:
systemd-nspawn@login.service - 当前
machinectl显示容器地址为192.168.49.2
| /etc/systemd/nspawn/login.nspawn | |
|---|---|
容器内当前承载了登录所需的基础服务,如 sshd、sssd 与 munge。
常用操作¶
BeeGFS (cls1-gateway)¶
cls1-gateway 当前承担 BeeGFS 管理节点,同时本机也作为客户端挂载共享文件系统。
- 管理服务:
beegfs-mgmtd.service - 管理配置:
/etc/beegfs/beegfs-mgmtd.toml - 客户端配置:
/etc/beegfs/beegfs-client.conf - 挂载配置:
/etc/beegfs/beegfs-mounts.conf - 认证文件:
/etc/beegfs/conn.auth
| /etc/beegfs/beegfs-client.conf | |
|---|---|
当前可见的挂载点包括:
/data/cls1-beegfs/data/cls1-beegfs/home/home
当前管理节点监听:
8008/udp8008/tcp8010/tcp
常用操作¶
Slurm (cls1-gateway)¶
cls1-gateway 承担 Slurm 控制面与记账服务;计算节点运行 slurmd,控制节点本机不运行 slurmd.service。
- 认证服务:
munge.service - 控制器:
slurmctld.service - 记账服务:
slurmdbd.service - 主配置:
/etc/slurm/slurm.conf - cgroup 配置:
/etc/slurm/cgroup.conf slurmdbd配置:/etc/slurm/slurmdbd.conf- 作业完成日志:
/data/cls1-beegfs/slurm/log/job-completion.log
slurmdbd 当前监听 6819/tcp,slurmctld 当前监听 6817/tcp。账务数据库通过本机 127.0.0.1:3306 提供,不对外暴露。