如何按首次出现顺序对元音与辅音字符分别排序并分组

如何按首次出现顺序对元音与辅音字符分别排序并分组

本文介绍在 php 中如何将字符串中的元音和辅音字符分别提取、转为小写、去除空格后,**按各字符在原字符串中首次出现的顺序进行分组,并按频次重复排列**(即“稳定频次排序”),而非简单保持遍历顺序或字母序。

要实现题目所要求的效果——例如输入 “Sample Case”,期望输出元音 “aaee”(a 出现 2 次、e 出现 2 次,且 a 先于 e 首次出现)、辅音 “ssmplc”(s 首次出现在索引 1 和 7,共 2 次;m/p/l/c 各 1 次,按首次出现顺序排列)——关键在于:既要统计频次,又要保留字符首次出现的相对顺序

原始代码的问题在于:它仅按遍历顺序收集字符($v 和 $c 是 FIFO 列表),因此输出 “aeae” 和 “smplcs”,这反映的是出现顺序,而非去重后的首次出现顺序 + 频次展开

正确解法需两步:

  1. 提取并归类:用正则过滤出元音([aeiou])和辅音([bcdfghjklmnpqrstvwxyz]),统一转小写、去空格;
  2. 频次统计 + 稳定排序:使用 array_count_values() 统计每个字符出现次数;再通过 str_split() 原始归类字符串,结合 array_keys() 获取唯一字符列表(PHP 7.4+ 中 array_keys(array_count_values($arr)) 会按首次出现顺序保留键),最后用 str_repeat() 按频次拼接。

以下是优化后的完整可运行函数:

Originality AI

Originality AI

专门为网络出版商设计的抄袭和AI检测工具

下载

function sortCharactersByFirstOccurrence($text) {
    $text = strtolower(str_replace(' ', '', $text));

    // 提取元音(仅 aeiou)和辅音(英文 21 字母,排除元音和空格)
    $vowelStr = preg_replace('/[^aeiou]/', '', $text);
    $consonantStr = preg_replace('/[^bcdfghjklmnpqrstvwxyz]/', '', $text);

    // 统计频次(array_count_values 保持首次出现顺序作为键序)
    $vowelFreq = array_count_values(str_split($vowelStr));
    $consonantFreq = array_count_values(str_split($consonantStr));

    // 按首次出现顺序拼接:array_keys() 返回唯一字符数组,顺序即首次出现顺序
    $vowels = '';
    foreach (array_keys($vowelFreq) as $char) {
        $vowels .= str_repeat($char, $vowelFreq[$char]);
    }

    $consonants = '';
    foreach (array_keys($consonantFreq) as $char) {
        $consonants .= str_repeat($char, $consonantFreq[$char]);
    }

    echo "Vowels     : {$vowels}/n";
    echo "Consonants : {$consonants}/n";
}

// 测试
sortCharactersByFirstOccurrence("Sample Case");
// 输出:
// Vowels     : aaee
// Consonants : ssmplc

注意事项

  • array_count_values() 在 PHP 中对 str_split() 结果生成的索引数组,其键(字符)的遍历顺序自 PHP 7.4 起保证为首次出现顺序(底层使用有序哈希表),因此可安全依赖;
  • 正则 /[^aeiou]/ 表示“非元音”,能精准剔除辅音与空格;同理 /[^bcdfghjklmnpqrstvwxyz]/ 仅保留辅音;
  • 若需兼容更广字符集(如带重音元音),应扩展正则或改用 mb_ 系列函数;
  • 该方案时间复杂度为 O(n),空间复杂度 O(k)(k 为不重复字符数),高效且可读性强。

总结:实现“按首次出现顺序的频次展开”,核心不是排序(sort() 会打乱顺序),而是利用 array_count_values() 的有序键特性 + array_keys() 提取稳定顺序,再逐个展开。这是处理“稳定频次分组”类问题的经典 PHP 模式。

https://www.php.cn/faq/2028862.html

发表回复

Your email address will not be published. Required fields are marked *