【数据处理】sed原理及使用举例(快速理解核心)

在做数据开发中,经常需要通过shell脚本/命令来针对文本进行预处理,sed是一个很强大的流式处理命令,笔者几乎每天都会用到,在这统一梳理总结了下! 其实 sed 很简单,比vim简单很多了! 1. 基础 核心概念 两个空间: 模式空间(pattern...

一种海量数据安全分类分级架构的实现

背景 随着《数据安全法》、《个人信息保护法》等相继出台,数据安全上升到国家安全层面和国家战略层面,数据分类分级已经成为了企业数据安全治理的必选题。然而数据分类分级的实现在行业内有很多痛点,主要体现在如下几点: 规则制定复杂:数据进行分类有多种维度,不...

在腾讯云这个圈子里我觉得自己了不起的点是我9月加入腾云先锋TDP的来,已经在VOC上累计提交了11个需求,其中7个待实现,1个已实现,看见了自己的建议或issue帮助产品更加好;谁说给程序员提需求非要产品经理呢,你看我作为程序员也是可以的。 在程序员这个...

小白轻松使用腾讯云GPU服务器部署OCR中英文识别服务

一直想搞一个GPU服务器来部署一下 PaddleOCR 的OCR识别服务,刚好腾讯云有一个活动,可以免费领取GPU服务器,可以来体验一自己部署OCR识别啦(CPU服务器也是可以部署的,但是识别速度不太理想~)。 这里不讲 AI 训练啥的,只说部署以及使用...

视频抽帧的全流程GPU异构加速实践

1. 背景 视频已成为内容和广告的主要媒介形式,但目前的视频内容理解或审核等AI能力,主流依然是先抽帧,再基于图像帧做特征提取和预测。抽帧由于步骤多、计算重,在视频AI推理场景很容易成为性能瓶颈。因此,有必要使用硬件加速等手段,来对视频抽帧做极致的性能优...

可以检查下日志,看看是是否有用户爬虫或者黑客攻击,建议网络排查下https://cloud.tencent.com/act/cps/redirect?redi合智互联客户成功服务热线:400-1565-661...

[5分钟玩转Lighthouse]用Matomo搭建网站流量统计系统

1. 背景目标 最近在尝试搭建博客,经过一番调研后,发现UP主溪歪歪_BILI的教学视频“如何搭建第一个博客站点”,用轻量应用服务器可以很快实现一个WordPress博客站点的搭建,搭建过程清晰明了,省时省力。但当搭建好博客后,想要对站点访问数据进行统计...