正则表达式解析http的bodyContent输出key-value

概述

近来一个同事给了一个文本要求写一个正则表达式解析。
文本如下

bodyContent:----------------------------964864704429906130621362
Content-Disposition: form-data; name="messageid"

PO
----------------------------964864704429906130621362
Content-Disposition: form-data; name="method"

putPOData
----------------------------964864704429906130621362
Content-Disposition: form-data; name="timestamp"

2022-02-16 13:48:19
----------------------------964864704429906130621362
Content-Disposition: form-data; name="format"

json
----------------------------964864704429906130621362
Content-Disposition: form-data; name="data"

{"xmldata":{"header":[{"CUSTOMERID":"201","EXPECTSTORAGEDATE":"","INOUTTYPE":1,"NOTES":"2019-2020下单提货","ORDERNO":"1001A2100000002DSYYS","ORDERTYPE":"21-Cxx-01","POCREATIONTIME":"2022-02-16 11:08:24","POREFERENCE2":"","POREFERENCE4":"CD20122021600131","SUPPLIERID":"201S10068","SUPPLIER_NAME":"xxx股份有限公司","USERDEFINE2":"陈xx","USERDEFINE3":"0124011","WAREHOUSEID":"WH01","detailsItem":[{"CUSTOMERID":"201","LOTATT01":"","LOTATT02":"","LOTATT04":"","LOTATT06":"浙械注准20192400498","LOTATT07":"肌钙蛋白I测定试剂盒(免疫荧光干式定量法)","LOTATT08":"N","NOTES":"","ORDEREDQTY":10,"ORDEREDQTY_EACH":10,"ORDERNO":"CD20122021600131","SKU":"694117919349","USERDEFINE1":"1001A2100000002DSYYT","USERDEFINE2":"1001A2100000002DSYYS"}]}]}}
----------------------------964864704429906130621362
Content-Disposition: form-data; name="OperationCode"

FLUXWMSJSAPI.operation
----------------------------964864704429906130621362--

这是一个http的body内容块,我稍微删除了几段,期望解析得到:
messageid:PO
method:putPOData
timestamp:2022-02-16 13:48:19
等。

思路

  1. 找出要匹配的文本块,类似:
name="messageid"

PO

首先将要查找的部分用通配符替换,把要匹配的部分用括号括起来。

name="(\S+)"[\n\r]+([ \S]+)

其中:

\S 表示非换行符
\n\r 表示换行和回车符
+ 表示至少一次
因为timestamp和data的内容部分的日期部分有空格,所以后面用到了[ \S]+
  1. 可以将正则表达式和文本拷贝到超好用的正则测试网站,输出结果符合预期:

    image.png

    如果不合适就调整正则表达式,根据表达式全集去调整。

  2. 要得到代码,可以使用正则表达式在线测试|菜鸟工具

    image.png

    需要稍作调整,
    比如javascript语言部分:

<script>
// 定义 正则 RegExp 对象
var pattern = new RegExp('name="(\\S+)"[\\n\\r]+([ \\S]+)',"g");
// 简化写法
// var pattern = /name="(\S+)"[\n\r]+([ \S]+)/g;

// 用 `` 括起长文本
var str = `
这里是长文本
`;

//console.log(str);
console.log(pattern);

// 匹配结果
var arr = null;
while(arr = pattern.exec(str)){
    console.log(arr[1]);
    console.log(arr[2]);
    console.log('\n\r');
}
</script>

用到了pattern.exec()和while循环。

php语言的写法:

<?php
$str = '这里是长文本';
// 或者使用
$str = <<<heredoc
这里是长文本
heredoc;
$isMatched = preg_match_all('/name="(\S+)"[\n\r]+([ \S]+)/', $str, $matches);
var_dump($str, $isMatched, $matches);
// $isMatched 匹配数量
// $matches 匹配结果,二维数组
// $matches[0] 是最外层的字符串 $matches[1]匹配的第1个括号  $matches[2]匹配的第2个括号

用到长文本表示,preg_match_all()。

java语言:

import java.io.BufferedReader;
import java.io.File;
import java.io.FileReader;
import java.util.regex.Matcher;
import java.util.regex.Pattern;


public class ZhengzeTest {

    public static String txt2String(File file) {
        StringBuilder result = new StringBuilder();
        try {
            BufferedReader br = new BufferedReader(new FileReader(file));//构造一个BufferedReader类来读取文件
            String s = null;
            while ((s = br.readLine()) != null) {//使用readLine方法,一次读一行
                result.append(System.lineSeparator() + s);
            }
            br.close();
        } catch (Exception e) {
            e.printStackTrace();
        }
        return result.toString();
    }

    public static void main(String[] args) {
        File file = new File("D:\\java\\code\\java-example\\src\\helloworld.txt");
        String str = txt2String(file);
//        System.out.println(str);

        String pattern = "name="(\\S+)"[\\n\\r]+([ \\S]+)";
        Pattern r = Pattern.compile(pattern);
        Matcher m = r.matcher(str);
        while (m.find()) { // 多个匹配结果,此处用while循环遍历
//            System.out.println(m.group(0)); // 匹配的完整字符串
            System.out.println(m.group(1)); // 匹配的第1个括号的内容,此处为key
            System.out.println(m.group(2)); // 匹配的第2个括号的内容,此处为value
            System.out.println();
        }
    }
}

用到了文件操作,while。

得到期望的结果:


image.png
最后编辑于
?著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,128评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,316评论 3 388
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,737评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,283评论 1 287
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,384评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,458评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,467评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,251评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,688评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,980评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,155评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,818评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,492评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,142评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,382评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,020评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,044评论 2 352

推荐阅读更多精彩内容