Агрегация данных — наиболее важная операция при работе с деревьями. Подсчитать общее число файлов в директории, общий размер всех файлов, получить список всех файлов, найти все файлы по шаблону, все это — примеры агрегирования данных.
Ключевым моментом в агрегирующих операциях является накопление результата. Для данной задачи хорошо подходит обход дерева в глубину с использованием рекурсивного процесса, который подробно рассматривается в предыдущем уроке. С его помощью мы обходим все узлы дерева и собираем результат, начиная с самого нижнего уровня.
Рассмотрим агрегацию с использованием рекурсивного процесса на примере подсчета общего количества узлов в дереве. То есть мы хотим узнать сколько всего файлов и директорий содержится в нашем файловом дереве.
<?php
$tree = mkdir('/', [
  mkdir('etc', [
    mkfile('bashrc'),
    mkfile('consul.cfg'),
  ]),
  mkfile('hexletrc'),
  mkdir('bin', [
    mkfile('ls'),
    mkfile('cat'),
  ]),
]);
// В реализации используем рекурсивный процесс,
// чтобы добраться до самого дна дерева.
function getNodesCount($tree)
{
  if (isFile($tree)) {
    // Возвращаем 1, для учета текущего файла
    return 1;
  }
  // Если узел — директория, получаем его детей
  $children = getChildren($tree);
  // Самая сложная часть
  // Считаем количество потомков для каждого из детей,
  // вызывая рекурсивно нашу функцию getNodesCount
  $descendantsCount = array_map(fn($child) => getNodesCount($child), $children);
  // Возвращаем 1 (текущая директория) + общее количество потомков
  return 1 + array_sum($descendantsCount);
}
getNodesCount($tree); // 8
Кода здесь немного, но он довольно хитрый. Есть несколько ключевых моментов:
- Функция проверяет тип узла. Если узел — это файл, тогда из функции возвращается единица
 - В случае, если узел — директория, тогда получаем детей и для каждого ребенка вновь вызываем нашу функцию. Затем повторяем алгоритм заново
 - Вызов функции на каждом ребенке возвращает свой собственный результат (количество его потомков). Эти результаты образуют массив с числами, которые нужно объединить
 - В конце считается общее количество всех потомков узла + единица (текущий узел сам по себе)
 
Перед тем как двигаться дальше, с этим кодом нужно "поиграть". Это единственный способ разобраться с ним.
Для полного доступа к курсу нужен базовый план
Базовый план откроет полный доступ ко всем курсам, упражнениям и урокам Хекслета, проектам и пожизненный доступ к теории пройденных уроков. Подписку можно отменить в любой момент.