small_gicp/doc_cpp/downsampling__omp_8hpp_source.html

 // SPDX-FileCopyrightText: Copyright 2024 Kenji Koide

 // SPDX-License-Identifier: MIT

 #pragma once


 #include <atomic>

 #include <memory>

 #include <iostream>


 #include <small_gicp/points/traits.hpp>

 #include <small_gicp/util/fast_floor.hpp>

 #include <small_gicp/util/vector3i_hash.hpp>

 #include <small_gicp/util/sort_omp.hpp>


 namespace small_gicp {


 template <typename InputPointCloud, typename OutputPointCloud = InputPointCloud>

 std::shared_ptr<OutputPointCloud> voxelgrid_sampling_omp(const InputPointCloud& points, double leaf_size, int num_threads = 4) {

   if (traits::size(points) == 0) {

     return std::make_shared<OutputPointCloud>();

   }


   const double inv_leaf_size = 1.0 / leaf_size;


   constexpr std::uint64_t invalid_coord = std::numeric_limits<std::uint64_t>::max();

   constexpr int coord_bit_size = 21;                       // Bits to represent each voxel coordinate (pack 21x3 = 63bits in 64bit int)

   constexpr size_t coord_bit_mask = (1 << 21) - 1;         // Bit mask

   constexpr int coord_offset = 1 << (coord_bit_size - 1);  // Coordinate offset to make values positive


   std::vector<std::pair<std::uint64_t, size_t>> coord_pt(traits::size(points));

 #pragma omp parallel for num_threads(num_threads) schedule(guided, 32)

   for (std::int64_t i = 0; i < traits::size(points); i++) {

     const Eigen::Array4i coord = fast_floor(traits::point(points, i) * inv_leaf_size) + coord_offset;

     if ((coord < 0).any() || (coord > coord_bit_mask).any()) {

       std::cerr << "warning: voxel coord is out of range!!" << std::endl;

       coord_pt[i] = {invalid_coord, i};

       continue;

     }

     // Compute voxel coord bits (0|1bit, z|21bit, y|21bit, x|21bit)

     const std::uint64_t bits =                                                           //

       (static_cast<std::uint64_t>(coord[0] & coord_bit_mask) << (coord_bit_size * 0)) |  //

       (static_cast<std::uint64_t>(coord[1] & coord_bit_mask) << (coord_bit_size * 1)) |  //

       (static_cast<std::uint64_t>(coord[2] & coord_bit_mask) << (coord_bit_size * 2));

     coord_pt[i] = {bits, i};

   }


   // Sort by voxel coords

   quick_sort_omp(coord_pt.begin(), coord_pt.end(), [](const auto& lhs, const auto& rhs) { return lhs.first < rhs.first; }, num_threads);


   auto downsampled = std::make_shared<OutputPointCloud>();

   traits::resize(*downsampled, traits::size(points));


   // Take block-wise sum

   const int block_size = 1024;

   std::atomic_uint64_t num_points = 0;


 #pragma omp parallel for num_threads(num_threads) schedule(guided, 4)

   for (std::int64_t block_begin = 0; block_begin < traits::size(points); block_begin += block_size) {

     std::vector<Eigen::Vector4d> sub_points;

     sub_points.reserve(block_size);


     const size_t block_end = std::min<size_t>(traits::size(points), block_begin + block_size);


     Eigen::Vector4d sum_pt = traits::point(points, coord_pt[block_begin].second);

     for (size_t i = block_begin + 1; i != block_end; i++) {

       if (coord_pt[i].first == invalid_coord) {

         continue;

       }


       if (coord_pt[i - 1].first != coord_pt[i].first) {

         sub_points.emplace_back(sum_pt / sum_pt.w());

         sum_pt.setZero();

       }

       sum_pt += traits::point(points, coord_pt[i].second);

     }

     sub_points.emplace_back(sum_pt / sum_pt.w());


     const size_t point_index_begin = num_points.fetch_add(sub_points.size());

     for (size_t i = 0; i < sub_points.size(); i++) {

       traits::set_point(*downsampled, point_index_begin + i, sub_points[i]);

     }

   }


   traits::resize(*downsampled, num_points);


   return downsampled;

 }


 }  // namespace small_gicp

fast_floor.hpp

small_gicp::traits::size
size_t size(const T &points)
Get the number of points.
Definition: traits.hpp:16

small_gicp::traits::point
auto point(const T &points, size_t i)
Get i-th point. 4D vector is used to take advantage of SIMD intrinsics. The last element must be fill...
Definition: traits.hpp:40

small_gicp::traits::set_point
void set_point(T &points, size_t i, const Eigen::Vector4d &pt)
Set i-th point. (x, y, z, 1)
Definition: traits.hpp:64

small_gicp::traits::resize
void resize(T &points, size_t n)
Resize the point cloud (this function should resize all attributes)
Definition: traits.hpp:58

small_gicp
Definition: flat_container.hpp:12

small_gicp::quick_sort_omp
void quick_sort_omp(RandomAccessIterator first, RandomAccessIterator last, const Compare &comp, int num_threads)
Quick sort with OpenMP parallelism.
Definition: sort_omp.hpp:95

small_gicp::fast_floor
Eigen::Array4i fast_floor(const Eigen::Array4d &pt)
Fast floor (https://stackoverflow.com/questions/824118/why-is-floor-so-slow).
Definition: fast_floor.hpp:12

small_gicp::voxelgrid_sampling_omp
std::shared_ptr< OutputPointCloud > voxelgrid_sampling_omp(const InputPointCloud &points, double leaf_size, int num_threads=4)
Voxel grid downsampling with OpenMP backend.
Definition: downsampling_omp.hpp:26

traits.hpp

sort_omp.hpp

vector3i_hash.hpp