C++ 字符串分割:6种实现方法对比 | 技术详解

C++ 字符串分割:6种实现方法对比 #

引言 #

字符串分割是编程中的常见需求,但C++标准库并未提供直接的split功能。本文将详细介绍6种不同的字符串分割实现方法,并分析各种方案的优缺点,帮助开发者选择最适合的实现方式。

众所周知C++标准库没有提供std::string的split功能,究竟为什么没有提供split方法,我查了很多资料,网上也有很多说法,但是依旧没有找到官方答案。

既然没有,那我们不如……按自己的方法实现一个好了。如果项目库里集成了boost的话,可以直接使用boost的split功能,我这里也列出了6种实现split的方法,分享一下,希望大家能拓宽下思路。

stringstream和getline配合使用 #

std::vector<std::string> stringSplit(const std::string& str, char delim) {
    std::stringstream ss(str);
    std::string item;
    std::vector<std::string> elems;
    while (std::getline(ss, item, delim)) {
        if (!item.empty()) {
            elems.push_back(item);
        }
    }
    return elems;
}

使用std::string::find #

std::vector<std::string> stringSplit(const std::string& str, char delim) {
    std::size_t previous = 0;
    std::size_t current = str.find(delim);
    std::vector<std::string> elems;
    while (current != std::string::npos) {
        if (current > previous) {
            elems.push_back(str.substr(previous, current - previous));
        }
        previous = current + 1;
        current = str.find(delim, previous);
    }
    if (previous != str.size()) {
        elems.push_back(str.substr(previous));
    }
    return elems;
}

使用std::string::find_first_of #

std::vector<std::string> stringSplit(const std::string& str, char delim) {
    std::size_t previous = 0;
    std::size_t current = str.find_first_of(delim);
    std::vector<std::string> elems;
    while (current != std::string::npos) {
        if (current > previous) {
            elems.push_back(str.substr(previous, current - previous));
        }
        previous = current + 1;
        current = str.find_first_of(delim, previous);
    }
    if (previous != str.size()) {
        elems.push_back(str.substr(previous));
    }
    return elems;
}

使用C语言的strtok方法 #

std::vector<std::string> stringSplit(const std::string& strIn, char delim) {
    char* str = const_cast<char*>(strIn.c_str());
    std::string s;
    s.append(1, delim);
    std::vector<std::string> elems;
    char* splitted = strtok(str, s.c_str());
    while (splitted != NULL) {
        elems.push_back(std::string(splitted));
        splitted = strtok(NULL, s.c_str());
    }
    return elems;
}

使用std::string::find_first_of和std::string::find_first_not_of配合使用 #

std::vector<std::string> stringSplit(const std::string& str, char delim) {
    std::vector<std::string> elems;
    auto lastPos = str.find_first_not_of(delim, 0);
    auto pos = str.find_first_of(delim, lastPos);
    while (pos != std::string::npos || lastPos != std::string::npos) {
        elems.push_back(str.substr(lastPos, pos - lastPos));
        lastPos = str.find_first_not_of(delim, pos);
        pos = str.find_first_of(delim, lastPos);
    }
    return elems;
}

使用正则表达式 #

std::vector<std::string> stringSplit(const std::string& str, char delim) {
    std::string s;
    s.append(1, delim);
    std::regex reg(s);
    std::vector<std::string> elems(std::sregex_token_iterator(str.begin(), str.end(), reg, -1),
                                   std::sregex_token_iterator());
    return elems;
}

参考资料 #

https://www.zhihu.com/question/36642771
http://www.martinbroadhurst.com/how-to-split-a-string-in-c.html