openfalcongrafana安装配置手册及注意事项内容摘要:

件、短信发送接口。 sender 这个模块和 redis 队列部署在一台机器上即可。 公司即使有几十万台机器,一个 sender 也足够了。 配置说明 { debug: true, : { enabled: true, listen: :6066 }, redis: { addr: :6379, 此处配置的 redis 地址要和后面的judge、 alarm 配置成相同的 maxIdle: 5 }, queue: { sms: /sms, 短信队列名称,维持默认即可, alarm 中也会有一个相同的配置 mail: /mail 邮件队列名称,维持默认即可, alarm 中也会有一个相同的配置 }, worker: { sms: 10, 调用短信接口的最大并发量 mail: 50 调用邮件接口的最大并发量 }, api: { sms: 各公司自行提供的短信发送接口, 这个 ip 只是个例子喽 ,如果未提供相应接口可删除该项 mail: 各公司自行提供的邮件发送接口 } } 如果没有邮件发送接口,可以使用 OpenFalcon mailprovider。 sender 的配置文件中配置了监听的 端口,我们可以访问一下 /health接口看是否返回 ok,我们所有的 Go后端模块都提供了 /health 接口,上面的配置的话就是这样验证: curl :6066/health 另外就是查看 sender 的 log, log 在 var 目录下 mailprovider { debug: true, : { listen: :4000, token: }, smtp: { addr: :25,发件服务器地址 username: ,发件箱用户 password: XXXX,发件用户密码 from: 此处表面邮件 来源,来件地址必须与发件服务器地址一致,如此处都为 @163 } } 配置启动 mailprovider 后,可使用如下命令测试是否能正常发送 curl d amp。 subject=thisismytestmailamp。 content=helloWorld 该命令向 qq邮箱发送了一个测试邮件,成功后邮箱中会收到该邮件: 注:不同的邮箱由于对邮件设置的安全过滤情况不同,可能导致测试邮件有收取不到的情况,如使用搜狐邮箱测试时,提示 success,但是仍然收不到邮件。 163做接收邮箱时,会报错,提示该邮件为垃圾邮件之类的(隔天还邮件提醒安全隐患。 ) 注意:测试成功后需要修改 sender 的邮件发送接口,接口地址改为: mail: web 前端 (Fe) 这是 Go版本的 UIC,也是一个统一的 web 入口,因为监控组件众多,记忆ip、 port 去访问还是比较麻烦。 fe像是一个监控的 hao123. 与 UIC 区别 Fe模块除了提供了一个简单的导航之外,最大的不同是密码存放方式发生了变化,所以 Java 版 UIC 用户如果要迁移过来,需要修改 Fe 模块配置的 salt,配置为空字符串,就可以和原来 Java 版本的 UIC 共用同一个数据库了,不过配置成空字符串不够安全,建议 salt 配置一个随机字符串,然后通过 Fe 注册一个新用户,把数据库中所有用户的密码都重置为这个新用户的密码,发个通知,让各个注册用户重新自己登录修改密码。 Fe作为一个前端模块,无状态,可以水平扩展,至少部署两台机器以保证可用性。 前面做一个负载均衡设备, nginx 或者 lvs 都可以。 最后为其申请一个域名,搞定。 配置介绍 { log: debug, pany: MI, 填写自己公司的名称,用于生成联系人二维码 : { enabled: true, listen: :1234 自己随便搞个端口,别跟现有的重复了,可以使用 8080,与老版本保持一致 }, cache: { enabled: true, redis: :6379, 这个 redis 跟 judge、 alarm 用的redis 不同,这个只是作为缓存来用 idle: 10, max: 1000, timeout: { conn: 10000, read: 5000, write: 5000 } }, salt: 0i923fejfd3, 搞一个随机字符串 canRegister: true, ldap: { enabled: false, addr: :389, baseDN: dc=example,dc=, bindDN: =mananger,dc=example,dc=, bindPasswd: 12345678, userField: uid, attributes: [sn,mail,telephoneNumber] }, uic: { addr: root:password@tcp(:3306)/uic?charset=utf8amp。 loc=Asia%2FChongqing, 数据库 schema 在 scripts 目录下 idle: 10, max: 100 }, shortcut: { falconPortal: 浏览器可访问的portal 地址 falconDashboard: 浏览器可访问的 dashboard 地址 falconAlarm: 浏览器可访问的alarm 的 地址 } } 注意: shortcut 中 设置的地址,按实际配置成内 /外网访问地址。 内网 ip:port 或者外网 ip:port 设置 root 账户密码 该项目中的注册用户是有不同角色的,目前分三种角色:普通用户、管理员、 root 账号。 系统启动之后第一件事情应该是设置 root 的密码,浏览器访问: (此处假设你的项目访问地址是 ,也可以使用 ip) ,这样就设置了 root 账号的密码为abc。 普通用户可以支持注册。 然后通过访问 fe 即可使用 root 登录(也可注册新用户), ldap 认证 Fe 现在支持通过 ldap 来进行用户认证。 不需要提前在 Fe 内开设账号。 Fe 会自动将 ldap 认证过来的新用户插入到 Fe 的数据库内。 配置说明 addr: :389, ldap 的地址和端口 baseDN: dc=example,dc=, ldap 的 baseDN, ldap 认证的时候将从这个路径开始查询用户 bindDN: =mananger,dc=example,dc=, 你用来连接 ldap 的账户,至少要有只读的查询权限。 注意这里应该是账户的完整 dn 值。 对于 AD 的话,则可以直接填账户的 userPrincipalName ()。 如果你的 ldap 允许匿名查询的话,填 值即可 bindPasswd: 12345678, 如果你的 ldap 允许匿名查询的话,填 值即可 userField: uid, 用于认证的属性(即你输入的用户名),通常为 uid 或 sAMAccountName(AD)。 也可以使用诸如 mail 的属性,这样认证的用户名就是邮箱 (前提 ldap 里有这个属性 ) attributes: [sn,mail,telephoneNumber] 数组顺序重要,依次为姓名,邮箱,电话在 ldap 中的属性名 . 建议根据自己 ldap 内的实际情况修改。 用户 ldap 登录时, fe 将按这些属性名去 ldap 中查询新用户的属性,并插入到 fe 的数据库内。 }, 这里我们先安装了 Fe 这个模块, portal、 dashboard、 alarm 等模块都还没有安装,所以 shortcut 中不知道如何配置才好。 不用着急,先维持默认,等之后部署完了 portal、 dashboard、 alarm 等模块之后再回来修改 fe 的配置。 portal Portal 是用来配置报警策略的 . Portal 是个 web 项目,无状态,可以水平扩展,至少部署两台机器以保证可用性,前面架设 nginx 或者 lvs 这种负载设备,申请一个域名,搞定。 Portal的配置文件在 frame/ virtualenv ./env ./env/bin/pip install defaulttimeout=100 r 修改一下数据库配置,数据库 schema 文件在 scripts 目录 DB_HOST = DB_PORT = 3306 DB_USER = root DB_PASS = DB_NAME = falcon_portal SECRET_KEY 尽量搞一个复杂点的随机字符串 SECRET_KEY = SESSION_COOKIE_NAME = falconportal PERMANENT_SESSION_LIFETIME = 3600 * 24 * 30 如果你使用的是 Go版本的 UIC,即 Fe 那个项目,下面的配置就配置成 Fe的地址即可,注意端口, Fe 的默认端口是 1234 internal 是内网可访问的 UIC(或者 Fe)地址 external 是外网可访问的 UIC(或者 Fe)地址,即用户通过浏览器访问的 UIC(或者 Fe)地址 UIC_ADDRESS = { 39。 internal39。 : 39。 39。 external39。 : 39。 39。 external39。 : 39。 } MAINTAINERS = [39。 root39。 ] CONTACT = 39。 社区版必须维持默认配置 COMMUNITY = True 我们可以 cp 用 中的配置覆盖 中的配置 嫌麻烦的话维持默认即可,也不用制作: from import *except Exception, e: print [warning] %s % e Portal 正常启动之后,就可以回去配置 Fe 这个项目的 shortcut 了。 当然,dashboard 和 alarm 还没有搭建,这俩 shortcut 还没法配置。 修改完了shortcut,要重启 fe模块。 heartbeat server(HBS) HBS 第一个功能: agent 发送心跳信息给 HBS 的时候,会把 hostname、 ip、agent version、 plugin version 等信息告诉 HBS, HBS 负责更新 host 表。 falconagent 有一个很大的特点,就是自发现,不用配置它应该采集什 么数据,就自动去采集了。 比如 cpu、内存、磁盘、网卡流量等等都会自动采集。 我们除了要采集这些基础信息之外,还需要做端口存活监控和进程数监控。 那我们是否也要自动采集监听的端口和各个进程数目呢。 我们没有这么做,因为这个数据量比较大,汇报上去之后用户大部分都是不关心的,太浪费。 于是我们换了一个方式,只采集用户配置的。 比如用户配置了对某个机器 80 端口的监控,我们才会去采集这个机器 80 端口的存活性。 那 agent 如何知道自己应该采集哪些端口和进程呢。 向 HBS 要, HBS 去读取 Portal 的数据库,返回给agent。 之后 我们会介绍一个用于判断报警的组件: Judge, Judge 需要获取所有的报警策略。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。