当前位置：首页 > 科技 > 软件

针对大规模服务日志敏感信息的长效治理实践

来源：责编：时间：2024-01-15 09:22:19 374观看

导读1 背景近年来，国家采取了多项重要举措来加强个人数据保护，包括实施《中华人民共和国网络安全法》和《个人信息保护法》等法律法规。这些举措旨在确保用户隐私的安全，同时确保企业合规运营。在处理敏感数据时，企业有责任采

1 背景

近年来，国家采取了多项重要举措来加强个人数据保护，包括实施《中华人民共和国网络安全法》和《个人信息保护法》等法律法规。这些举措旨在确保用户隐私的安全，同时确保企业合规运营。在处理敏感数据时，企业有责任采取适当的措施来保护用户信息。

在数据保护方面，日志记录成为一个需要特别关注的敏感信息领域。因此，本文将重点介绍转转在日志脱敏方面的应用与实践。

2 目标与措施

目标：对日志内的手机号、身份证号、银行卡号等敏感信息脱敏，建立一个可持续的日志敏感信息管控机制。

措施：

检测和定位存在敏感日志的服务与CASE；
开发低接入成本的日志脱敏工具；
推动相关业务进行迭代修改；
长期监控和持续治理，确保日志安全。

图片

我们的第一步是利用大数据离线扫描服务日志，并使用正则表达式匹配敏感信息。

然而，第二和第三步是挑战的关键，即如何在不干扰业务正常迭代排期的情况下，推动大量服务的日志做脱敏。我们希望使用技术手段尽量降低业务日志脱敏的人力成本。

3 实施

参考《转转日志规范》查看标准日志输出要求，在此基础之上，提供一些工具辅助业务对日志脱敏。

【推荐】JavaBean类需实现toString()方法，日志直接打印对象，慎用JSON工具将对象转换成String。

3.1 脱敏工具类

我们开发了脱敏工具类，期望业务同学在实现JavaBean toString()方法的同时，使用脱敏工具对敏感字段使用脱敏。

图片

desensitize(String input)：通用脱敏函数，支持对任意字符脱敏，将提取字符串中4位以上数字(如手机号、银行卡号、身份证号、数字验证码等)做脱敏；
desensitizeByInputLength(String input)：据字符串长度匹配不同的脱敏规则，如：11位则使用手机号脱敏规则，18位则使用身份证号脱敏规则；
desensitizePhoneNumber(String phoneNumber)：脱敏手机号，前3位和后4位，中间的数字用*代替；
desensitizeIDCard(String idCard)：脱敏身份证号, 保留前6位和后4位，脱敏7~15位生日信息, 用*代替；
desensitizeBankCardNumber(String bankCardNumber)：脱敏银行卡号, 前6位和后4位，中间的数字用*代替。

public final class DesensitizeUtil {            /**     * 根据字符串长度匹配不同的脱敏函数, 强制脱敏     */    public static String desensitizeByInputLength(String input) {        int length = input.length();        // 手机号        if (length == 11) {            return desensitizePhoneNumber(input);        }        // ,,,    }    /**     * 脱敏手机号, 前3位和后4位，中间的数字用*代替     */    public static String desensitizePhoneNumber(String phoneNumber) {        // 11位手机号        if (phoneNumber.length() == 11) {            return phoneNumber.substring(0, phoneNumber.length() - 8) + "****" + phoneNumber.substring(phoneNumber.length() - 4);        }        return phoneNumber;    }        // 省略其他脱敏函数...}

3.2 JSON脱敏

在某些日志记录的场景中，会打印包含敏感字段的JSON格式的数据，需要对其中的敏感信息进行脱敏处理。

在常见的JSON工具中，比如Jackson，可以使用自定义的序列化器/反序列化器来实现脱敏。下面以Jackson为例进行说明：

首先，我们可以定义一个注解来标注哪些字段需要脱敏处理：

/** * 脱敏注解 */@Target({ElementType.FIELD})@Retention(RetentionPolicy.RUNTIME)@Documentedpublic @interface Desensitize { }

然后，我们可以创建一个自定义的Jackson模块，通过继承BeanSerializerModifier类来修改字段的序列化行为。在这个类中，我们可以根据字段上的Desensitize注解来判断是否需要进行脱敏处理：

/** * Jackson脱敏序列化修改器 */public class JacksonDesensitizeSerializerModifier extends BeanSerializerModifier {    @Override    public List<BeanPropertyWriter> changeProperties(SerializationConfig config, BeanDescription beanDesc,                                                     List<BeanPropertyWriter> beanProperties) {        for (BeanPropertyWriter beanProperty : beanProperties) {            // 只针对使用了@Desensitize的字段做脱敏            Desensitize desensitize = beanProperty.getAnnotation(Desensitize.class);            if(desensitize != null) {                // 指定自定义的序列化器                beanProperty.assignSerializer(new Desensitization());            }        }        return beanProperties;    }    /**     * Jackson序列化器     */    public class Desensitization extends StdSerializer<Object> {        @Override        public final void serialize(Object value, JsonGenerator gen, SerializerProvider provider) throws IOException {            // 根据长度对字段做脱敏            String desensitize = DesensitizeUtil.desensitizeByInputLength(String.valueOf(value));            gen.writeString(desensitize);        }    }}

最后，我们需要注册这个自定义的模块到Jackson中

/** * JSON工具 */public class JsonUtil {    private static final ObjectMapper DESENSITIZE_OBJECT_MAPPER = newObjectMapper();    private static ObjectMapper newObjectMapper() {        ObjectMapper mapper = new ObjectMapper();        //增加脱敏序列化器        SimpleModule simpleModule = new SimpleModule("SimpleModuleDesensitize");        simpleModule.setSerializerModifier(new JacksonDesensitizeSerializerModifier());        mapper.registerModule(simpleModule);        return mapper;    }       /**    * 对象转JSON的自动脱敏工具    */    public static <T> String object2DesensitizeString(T object) throws JsonProcessingException {        return DESENSITIZE_OBJECT_MAPPER.writeValueAsString(object);    }        //...}

对于业务同学而言，只需在需要脱敏的对象上添加脱敏注解，然后使用我们提供的JsonUtil进行脱敏操作，实现简单高效。

/** * 需要脱敏的对象 */public class User {          /**     * 标记此字段需要脱敏     */    @Desensitize    private String mobile;    private String username;        //getter setter...}User user = new User();user.setAge(18);user.username = "zhangsan";user.password = "123456";JsonUtil.object2DesensitizeString(user);//输出结果: {"mobile":"135****5555","username":"张三"}

注意：以上代码只是一个示例，并不完整。在实际使用中，还需要根据具体的需求来灵活实现脱敏处理。

3.3 APT自动脱敏

在实际实施过程中，以上两个方案遇到了很多阻碍。主要问题在于业务同学手动维护Bean的toString()方法过于繁琐、重复工作多、容易遗漏对象并导致增加或删除字段时需要不断修改toString()函数。此外，业务服务所依赖的Bean来源复杂，有可能是其他业务提供的第二方Jar包或第三方Jar包。

因此，在实际应用中，业务同学更倾向于将Bean序列化为JSON并输出到日志中，如下所示：

log.info("data={}", JsonUtil.object2DesensitizeString(bean));

然而，这种方法不符合《转转日志规范》要求，而且忽略了JSON序列化性能的问题。此外，这种方案也需要耗费大量的人力资源：需要评估每一行日志，以确定是否需要添加JSON脱敏功能。

因此，业务同学提出了以下需求：是否可以实现类似Lombok一样的功能，只需在Bean的字段上添加脱敏注解，就能在编译期自动实现脱敏后的toString()函数？这样的话，在打印日志时直接打印对象即可自动脱敏。

经过调研发现，Lombok在编译时利用APT（Annotation Processing Tools）生成代码，实现了自动化的代码生成过程，从而简化了开发工作。

APT（Annotation Processing Tool）是Java的编译期注解处理器。它允许开发人员在编译期间处理注解，并根据注解和相关对象的信息生成Java代码模板或配置文件等。
APT的使用可以提高程序性能，因为它在代码编译时完成注解处理，而不是在运行时使用反射方式处理注解。
著名的开源框架，如Lombok、MapStruct和AutoService等，也使用了类似的技术来优化代码的生成和处理过程。

图片

我们利用APT技术实现了这样的功能：如果一个类没有重写Object.toString()方法，在编译时会自动为该类生成一个脱敏后的toString()方法。这个自动生成的toString()方法能够识别脱敏注解，并在生成的toString()方法内对敏感信息进行脱敏处理。

在Java编译后的Class文件中，toString()方法可能来自三个来源：源代码、转转APT处理、Lombok等。优先级为：源代码 > 转转APT处理 > Lombok等其他APT。简言之，我们的APT处理不会覆盖源代码中定义的toString()方法，但会覆盖由Lombok生成的toString()方法。

比如，我们有以下源码：

class User {    private String username;    /**     * 密码，增加了脱敏注解     */    @Desensitize    private String password;}

在接入转转APT后，反编译的Class文件如下：

class User {    private String username;    @Desensitize    private String password;    public String toString() {        StringJoiner sj = new StringJoiner(", ", "User[", "]");                if (this.username != null) {            sj.add("username=" + this.username);        }         if (this.password != null) {            sj.add("password=" + DesensitizeUtil.desensitizeByInputLength(value));        }         return sj.toString();    }}

测试如下：

User user = new User();user.username = "zhangsan";user.password = "123456";System.out.println(user);  //输出结果: User[username=张三, password=1****6]

这个功能的上线大大降低了业务同学实现日志脱敏的工作量，只需为字段添加脱敏注解即可。同时，也解决了线上对象未重写Object.toString()时打印日志的尴尬问题。

不过，在落地APT过程中，我们也遇到了一些问题，希望能给读者提供一些有收益的参考。

3.3.1 本地缓存问题

在某个服务的Spring Bean上，有一个包含大量本地缓存的List字段，这个服务会打印Spring Bean对象到日志中。在引入转转APT之前，一切正常；但引入后，出现了频繁的OOM问题。通过内存分析后发现，问题出在转转APT为Spring Bean自动生成的toString()函数内产生了大量的字符串上。

@Servicepublic class AppService {    /**     * 本地缓存     */    private List<Object> cache = new ArrayList<>();    }@Autowiredprivate AppService service;log.info("service={}", service);

我们观察到大部分带有本地缓存（或者高内存占用字段）的对象都是Spring的Bean，因此，我们对转转APT进行了修改：即不再为Spring Bean生成toString()函数。

3.3.2 JDK序列化问题

某个服务的JavaBean使用了原生JDK的序列化/反序列化工具，但是这个JavaBean却没有添加serialVersionUID。

class Person implements Serializable {    // 没有定义serialVersionUID    // private static final long serialVersionUID = -55721300387280236L;}

Java序列化机制使用long型的serialVersionUID字段来标志类的版本号；序列化对象时，JVM会将serialVersionUID的值写入序列化数据中；反序列化时，JVM会将序列化数据中的serialVersionUID与对应类中的serialVersionUID进行比较，若不同，则抛出InvalidCastException；若版本号相同，则能够进行反序列化。
当一个类没有显式定义serialVersionUID时，JVM会自动根据类的信息计算生成一个默认的serialVersionUID。这样，在类发生变化时，自动生成的serialVersionUID可能会改变，导致无法正确反序列化之前的数据。

引入转转APT后，由于自动生成了toString函数，类信息发生变化，导致serialVersionUID也发生了改变，进而导致反序列化失败。

解决方式是将之前默认生成的serialVersionUID找到，并将其添加到类的源码中。

3.4 弃用方案

还有一种快速落地的方法是，通过在应用程序内部统一拦截日志输出，正则匹配敏感信息，并利用脱敏工具进行脱敏处理。

我们没有使用这种方式的原因是因为：脱敏应尽量避免正则匹配，容易误伤且性能低下。

4 规划

上文提过，服务内依赖的Java Bean来源十分复杂，我们目前只解决了对象本身的脱敏问题。而对于服务依赖的Jar包版本控制，仍需要业务团队梳理依赖关系，并手动修改脱敏后的Jar包版本，这一过程仍需要耗费较多的时间和人力。

考虑到这个问题，是否可以为每个服务提供一个依赖关系管控系统？该系统可以对Jar包的版本实现自动更新、自动化测试、灰度发布、自动发布和回滚等一系列功能。对于转转目前的情况来说，我相信这不是一个技术问题，而是一个需要更多时间来完善的TODO List。

图片

5 总结

一个小小的功能日志脱敏，却经历了多个阶段与挑战，从敏感日志的发现到开发脱敏工具类，再到Json脱敏，再到APT脱敏，最终推动业务应用。核心的挑战在于如何做好推动相关的工作？

我认为，推动相关工作的核心在于有效应对内在和外在的因素。然而，外部因素对推动的阻力常常更大，要成功推动工作，转变外部阻力为内部动力至关重要。而对于推动者而言，换位思考、勇于挑战未知、深入追根究底的打磨产品会使产品更容易被接受和推广。

本文链接：http://www.28at.com/showinfo-26-61003-0.html针对大规模服务日志敏感信息的长效治理实践

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇： vivo 海量微服务架构最新实践

下一篇： Rust又被降本增效选中！Rust替代Python，亚马逊云成本降为1/4！

标签：

热门焦点

十个可以手动编写的 JavaScript 数组 API

JavaScript 中有很多API，使用得当，会很方便，省力不少。你知道它的原理吗? 今天这篇文章，我们将对它们进行一次小总结。现在开始吧。1.forEach()forEach()用于遍历数组接收一参
JVM优化：实战OutOfMemoryError异常

一、Java堆溢出堆内存中主要存放对象、数组等，只要不断地创建这些对象，并且保证 GC Roots 到对象之间有可达路径来避免垃圾收集回收机制清除这些对象，当这些对象所占空间超过
阿里大调整

来源：产品刘有媒体报道称，近期淘宝天猫集团启动了近年来最大的人力制度改革，涉及员工绩效、层级体系等多个核心事项，目前已形成一个初步的“征求意见版”：1、取消P序列
小米汽车电池信息疑似曝光：容量101kWh，支持800V高压快充

7月14日消息，今日一名博主在社交媒体发布了一张疑似小米汽车电池信息的照片，显示该电池包正是宁德时代麒麟电池，容量为101kWh，电压为726.7V，可以预测小
华为开发者大会2023日程公开：开设鸿蒙HarmonyOS 4体验区

IT之家 7 月 31 日消息，华为今日公布了 HDC.Together 开发者大会 2023 的详细日程。整场大会将于 8 月 4 日-6 日之间举行，届时将发布最新一代鸿蒙 H
7月4日见！iQOO 11S官宣：“鸡血版”骁龙8 Gen2+200W快充加持

上半年已接近尾声，截至目前各大品牌旗下的顶级旗舰都已悉数亮相，而下半年即将推出的顶级旗舰已经成为了数码圈爆料的主流，其中就包括全新的iQOO 11S系
iQOO 11S或7月上市：搭载“鸡血版”骁龙8Gen2 史上最强5G Soc

去年底，iQOO推出了“电竞旗舰”iQOO 11系列，作为一款性能强机，iQOO 11不仅全球首发2K 144Hz E6全感屏，搭载了第二代骁龙8平台及144Hz电竞屏，同时在快充
OPPO K11搭载高性能石墨散热系统：旗舰同款性能凉爽释放

日前OPPO官方宣布，将于7月25日14:30举办新品发布会，届时全新的OPPO K11将正式与大家见面，将主打旗舰影像，和同档位竞品相比，其最大的卖点就是将配备索尼
利用职权私自解除被封帐号 Meta开除20多名员工

11月18日消息，据外媒援引知情人士表示，过去一年时间内，Facebook母公司Meta解雇或处罚了20多名员工以及合同工，指控这些人通过内部系统以不当方式重置用户帐号，其

针对大规模服务日志敏感信息的长效治理实践

1 背景

2 目标与措施

3 实施

3.1 脱敏工具类

3.2 JSON脱敏

3.3 APT自动脱敏

3.3.1 本地缓存问题

3.3.2 JDK序列化问题

3.4 弃用方案

4 规划

5 总结

十个可以手动编写的 JavaScript 数组 API

JVM优化：实战OutOfMemoryError异常

阿里大调整

小米汽车电池信息疑似曝光：容量101kWh，支持800V高压快充

华为开发者大会2023日程公开：开设鸿蒙HarmonyOS 4体验区

7月4日见！iQOO 11S官宣：“鸡血版”骁龙8 Gen2+200W快充加持

iQOO 11S或7月上市：搭载“鸡血版”骁龙8Gen2 史上最强5G Soc

OPPO K11搭载高性能石墨散热系统：旗舰同款性能凉爽释放

利用职权私自解除被封帐号 Meta开除20多名员工

最新推荐

猜你喜欢

热门推荐

相关资讯