阿里云容器服务ACS升级1.18.8-aliyun.1 踩坑记录

公司的项目的云服务提供方均为阿里云,为了减少运维成本,也基本基于阿里云的产品进行构建。 当然这样做有好处,也有不足,好处是:大大减少了相关产品运维成本更加方便。 不足就是一旦用上了阿里云的这种相关产品以后基本不太可能迁移他处,迁移成本过大。 阿里云的容器服务ACS产品(我们采用的是托管版本),一般半年期一个大版本升级,要持续跟进阿里云的升级进度,否则就会进入非维护期的产品系列了。 不过每次升级其实都是提心吊胆。最近一直提示可更新至1.18.8-aliyun.1版本,遂几个集群逐一开始升级,一般情况是没有问题的。 可今天就出现了幺蛾子。 其中一个集群在升级时死活不行(相同配置的其他集群OK): 遇到这种情况只能寻求阿里云官方帮助解决,官方的工单服务还是不错的。最终得到的回复是其中一个Node资源不足引起的。 其实整体Node资源占用率仅为30%左右,而CPU一般在10%以下,每个node机器配置为:8核64G,上面业务Pod数10个左右,每个内存资源占用大概2G,很难理解哪块资源会不足,由于情况紧急并未深究此原因,紧急解决之。 最终的解决办法是先取消升级,排空该Node,再重新升级集群解决此问题。 当然阿里云给出的第一套建议是直接从集群中删除此node,升级完成后再添加回来,这个方法基本可以解决100%的node异常问题,但由于我们这节点上手动安装了dns等其他服务无法采用该方式,只能放弃。

某世界五百强企业的webapi设计

年底公司某项目要与相关系统进行对接,其中有一家隶属于某世界五百强企业,了解了这家公司的webapi接口后,感觉简直让人骇人听闻。这是我从业N多年以来第一次遇到的如此“高大上”的系统,果然不愧为世界五百强企业,直是不吐不快。 下面简单聊一下: 一、系统安全性 这个安全性是完全不存在的,作为一个很重要的系统,对外提供的webapi接口不做任何权限校验,只要知道报文,就可以尽情调用,吓得一身冷汗。 二、文档准确性 前期确实提供了一份文档,结果项目组进行调试时,发现没有一个接口可以调通。后经了解:这个文档都是错的,历史上N久以前的,都无法使用,现代的系统没有文档。 而后又直接甩过来一堆测试报文,结果亦是错漏百出,很多东西需要靠猜。 三、接口的稳定、完整性 完全没有稳定性可言。 例如:某物品下单时,突然间没有库存了,正常来说应该返回一个错误码,加上一个des文字说明。 而实际上只返回一个 null,连整个报文结构都没有了,让人不知所以。 调试若有任何报错,统统只返回null ,无任何报错信息。 最夸张的是,比如进行某列表搜索时,如果返回结果为0,此时也会给你返回 null 。 在返回json 结构时,有的时候居然不是标准的json报文 ,明显是通过字符串拼接json,而在拼接过程中特殊符号没有转义,导致了json整体结构的损坏,这让人咋接收解析呢? 感觉即使初学编程的学生,也很难堆出这样“高大上”的系统来吧? 虽然这个世界五百强并非互联网也非软件产业,但也是有点夸张了。 相信这应该是临时工干的吧,嗯 应该是体育专业转过来的吧。

openanolis Linux安装体验

官网地址: https://openanolis.org/ 据介绍OpenAnolis 完全兼容Centos8软件体系,阿里云与统信软件及众多芯片厂家和领先云计算厂家一起,在OpenAnolis社区中打造原生开源操作系统发行版,兼容国际Linux主流厂商,支持多硬件架构,打造一个面向未来的开源操作系统。 其中kernel 保持当前最新的stable 版本,一些最新的kernel技术都可以直接原生使用,而不用自己冒险升级内核。 简单介绍一下作为一个Linux用户的简单使用体验 安装体验上感觉与Centos8完全一致,除了LOGO图标变了以外没啥其他区别。 系统启动时,醒目的Linux kernel 5.10 还是非常让人兴奋的。 进入系统后,所有操作均与centos8一致。 最大的问题是系统默认不带软件源,跟华为openeuler是一个问题,作为比较流行的Linux系统,一般都自带丰富的软件生态,而这个根本啥也没有,让人咋安装软件? 虽然说所有的软件均可以自己编译、安装,但这个时间成本可太大了,初始安装(一般喜欢是minimal安装,自己安装所需软件即可)时系统没有wget命令,没有vim命令,最基础的命令都要一个一个去下载编译? 既然与centos8软件生态兼容,遂下载centos8的软件源尝试,实验证明确实是兼容的,此时可以与使用 dnf install vim wget -y 正常安装相关软件了。 但问题又来了,centos8马上要停更了,软件源不也废了吗? 之前有一台服务器安装了openeuler,手动配置了openeuler官方软件源,用了快一年的时间,一堆的漏洞愣是啥也不更新? 难道开箱方式不对? 作为一个普通的大众用户诉求其实很简单,只要稳定、安全,生命周期尽可能长些就够了。所谓宣传的那些高大上、花里胡哨的东西其实并不是特别关心,首先满足基本需求才是最重要的。

Thinkpad 突然无法开机错误

前年的时候公司统一更新换代笔记本,更换型号为Thinkpad T480。都是高配版本当时最新的八代I7U+256固态+1T机械。 从去年开始陆陆续续就出现电脑故障、异常。其实最终原因都是因为这块256G NVME.2242型号的硬盘出现的问题,为啥是这个出问题呢?因为这块硬盘是供应商给更换的杂牌山寨货,具体牌子就不说了,为了偷工简料,提高利润,居然在这小小的,但非常重要的硬盘上下手。 这不今天旁边同事电脑报这个错: Unauthorized WWAN network card is plugged in.Power off and remove it 现象是: 点击开机按钮很长时间无响应,过了一段时间会出现这个错误,乍一看感觉好像是网卡有问题,自己动手拆开电脑,把网卡拿掉,依然不行。 按照以往经验,甩锅到256G的硬盘上,重新申请了一块东芝硬盘换上试试,居然立马正常。 总结 对于这些电子产品的采购一定要选择靠谱一些,有良心一些的供应商,否则这样三天两头出问题,着实是很让人上火,还耽误正常的工作。

群晖 raid1 升级更换大容量硬盘

之前一直用的DIY的大台式机跑着黑群晖,550W大电源,带着5块硬盘(3块主机用,2块群晖用)+ RX590独立显卡+3个RGB风扇,刚开始还担心功率太大,后来经测试待机功耗一般在60W 左右,还是可以接受的,比单独购买NAS动辄三四千的价格,还是便宜了非常多的。硬盘用的是一个4T+2T组raid1一共2T可用,之前还够用,用着用着,这容量就有点捉襟见肘。 于是又入手一块4T硬盘,准备把之前的2T替换掉,这样应该又可以坚持几年。之前那块4T是希捷NAS专用酷狼,后来觉得这酷狼还是太贵了,这次入手了一块便宜的酷鹰应该就足够。 更换过程倒是很简单,直接将2T拔出来,换上新的4T自动重建raid1就可以,数据丢失问题基本不用担心,也无需进行额外的备份,因为拔出来的那2T的本身就是一个备份,机器上还有一块4T的备份呢,所以完全无需担心数据损坏。 等修复重建结束,容量自动升级到大容量,一切正常。

新房装修之乳胶漆选择

首先讲一下,乳胶漆是一种合成涂料,百分百含有甲醛的,只是含量多少不同而已,正常来说刷完乳胶漆至少等半年以后入住才好一些。 由于装修是选择的半包,其中是包括乳胶漆的,是一款据说是进口的 【来威漆】装修公司说这款很环保,质量很不错,就轻信了此话。 型号大概是一款叫做玛尔赛的款。如下图: 使用完之后的效果感觉挺差的,至少从感观上来说,家里没上任何家具的前提下味道比较大,到目前已经三个月了依然有较大的味道,此为本次装修的最大败笔。 在此建议大家,乳胶漆建议一定选择大品牌的高端一些的型号,从价格上来讲,正规大厂家至少1000左右一桶(15L),这个规格以上的应该会好些,否则即使事后花费好几千清除异味也只是暂时的,这个异味会持续释放。


正在读取数据……