Агрегация данных — наиболее важная операция при работе с деревьями. Подсчитать общее число файлов в директории, общий размер всех файлов, получить список всех файлов, найти все файлы по шаблону, все это — примеры агрегирования данных.
Ключевым моментом в агрегирующих операциях является накопление результата. Для данной задачи хорошо подходит обход дерева в глубину с использованием рекурсивного процесса, который подробно рассматривается в предыдущем уроке. С его помощью мы обходим все узлы дерева и собираем результат, начиная с самого нижнего уровня.
Рассмотрим агрегацию с использованием рекурсивного процесса на примере подсчета общего количества узлов в дереве. То есть мы хотим узнать сколько всего файлов и директорий содержится в нашем файловом дереве.
<?php
$tree = mkdir('/', [
mkdir('etc', [
mkfile('bashrc'),
mkfile('consul.cfg'),
]),
mkfile('hexletrc'),
mkdir('bin', [
mkfile('ls'),
mkfile('cat'),
]),
]);
// В реализации используем рекурсивный процесс,
// чтобы добраться до самого дна дерева.
function getNodesCount($tree)
{
if (isFile($tree)) {
// Возвращаем 1, для учета текущего файла
return 1;
}
// Если узел — директория, получаем его детей
$children = getChildren($tree);
// Самая сложная часть
// Считаем количество потомков для каждого из детей,
// вызывая рекурсивно нашу функцию getNodesCount
$descendantsCount = array_map(fn($child) => getNodesCount($child), $children);
// Возвращаем 1 (текущая директория) + общее количество потомков
return 1 + array_sum($descendantsCount);
}
getNodesCount($tree); // 8
https://repl.it/@hexlet/php-trees-aggregation-getNodesCount
Кода здесь немного, но он довольно хитрый. Есть несколько ключевых моментов:
- Функция проверяет тип узла. Если узел — это файл, тогда из функции возвращается единица
- В случае, если узел — директория, тогда получаем детей и для каждого ребенка вновь вызываем нашу функцию. Затем повторяем алгоритм заново
- Вызов функции на каждом ребенке возвращает свой собственный результат (количество его потомков). Эти результаты образуют массив с числами, которые нужно объединить
- В конце считается общее количество всех потомков узла + единица (текущий узел сам по себе)
Перед тем как двигаться дальше, с этим кодом нужно "поиграть". Это единственный способ разобраться с ним.
Остались вопросы? Задайте их в разделе «Обсуждение»
Вам ответят команда поддержки Хекслета или другие студенты
Для полного доступа к курсу нужен базовый план
Базовый план откроет полный доступ ко всем курсам, упражнениям и урокам Хекслета, проектам и пожизненный доступ к теории пройденных уроков. Подписку можно отменить в любой момент.