d9/d66/beta__projectors__base_8cpp_source.html

// Copyright (c) 2013-2022 Anton Kozhevnikov, Thomas Schulthess

// All rights reserved.

//

// Redistribution and use in source and binary forms, with or without modification, are permitted provided that

// the following conditions are met:

//

// 1. Redistributions of source code must retain the above copyright notice, this list of conditions and the

//    following disclaimer.

// 2. Redistributions in binary form must reproduce the above copyright notice, this list of conditions

//    and the following disclaimer in the documentation and/or other materials provided with the distribution.

//

// THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR IMPLIED

// WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A

// PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT HOLDER OR CONTRIBUTORS BE LIABLE FOR

// ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO,

// PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER

// CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR

// OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.


/** \file beta_projectors_base.cpp

 *

 *  \brief Contains implementation of beta-projectors generator.

 */


#include <stdexcept>

#include "beta_projectors_base.hpp"

#include "core/la/linalg_base.hpp"

#include "core/profiler.hpp"

#include "core/env/env.hpp"

#include "core/wf/wave_functions.hpp"


namespace sirius {


#if defined(SIRIUS_GPU)

void

create_beta_gk_gpu(int num_atoms, int num_gkvec, int const* beta_desc, std::complex<float> const* beta_gk_t,

                   double const* gkvec, double const* atom_pos, std::complex<float>* beta_gk)

{

    create_beta_gk_gpu_float(num_atoms, num_gkvec, beta_desc, beta_gk_t, gkvec, atom_pos, beta_gk);

}


void

create_beta_gk_gpu(int num_atoms, int num_gkvec, int const* beta_desc, std::complex<double> const* beta_gk_t,

                   double const* gkvec, double const* atom_pos, std::complex<double>* beta_gk)

{

    create_beta_gk_gpu_double(num_atoms, num_gkvec, beta_desc, beta_gk_t, gkvec, atom_pos, beta_gk);

}

#endif


/// Internal implementation of beta-projectors generator.

namespace local {


template <class T>

void

beta_projectors_generate_cpu(sddk::matrix<std::complex<T>>& pw_coeffs_a,

        sddk::mdarray<std::complex<T>, 3> const& pw_coeffs_t, int ichunk__, int j__, beta_chunk_t const& beta_chunk,

        Simulation_context const& ctx, fft::Gvec const& gkvec)

{

    PROFILE("beta_projectors_generate_cpu");


    using numeric_t      = std::complex<T>;

    using double_complex = std::complex<double>;


    int num_gkvec_loc = gkvec.count();

    auto& unit_cell   = ctx.unit_cell();


    #pragma omp parallel for

    for (int i = 0; i < beta_chunk.num_atoms_; i++) {

        int ia = beta_chunk.desc_(static_cast<int>(beta_desc_idx::ia), i);


        double phase           = twopi * dot(gkvec.vk(), unit_cell.atom(ia).position());

        double_complex phase_k = std::exp(double_complex(0.0, phase));


        std::vector<double_complex> phase_gk(num_gkvec_loc);

        for (int igk_loc = 0; igk_loc < num_gkvec_loc; igk_loc++) {

            auto G = gkvec.gvec<index_domain_t::local>(igk_loc);

            /* total phase e^{-i(G+k)r_{\alpha}} */

            phase_gk[igk_loc] = std::conj(ctx.gvec_phase_factor(G, ia) * phase_k);

        }


        int offset_a = beta_chunk.desc_(beta_desc_idx::offset, i);

        int offset_t = beta_chunk.desc_(beta_desc_idx::offset_t, i);

        int nbeta    = beta_chunk.desc_(beta_desc_idx::nbf, i);

        for (int xi = 0; xi < nbeta; xi++) {

            for (int igk_loc = 0; igk_loc < num_gkvec_loc; igk_loc++) {

                pw_coeffs_a(igk_loc, offset_a + xi) =

                    pw_coeffs_t(igk_loc, offset_t + xi, j__) * static_cast<numeric_t>(phase_gk[igk_loc]);

            }

        }

    }

}


// explicit instantiation

template void

beta_projectors_generate_cpu<double>(sddk::matrix<std::complex<double>>&,

        sddk::mdarray<std::complex<double>, 3> const&, int, int, beta_chunk_t const&, Simulation_context const&,

        fft::Gvec const&);

#ifdef SIRIUS_USE_FP32

// explicit instantiation

template void

beta_projectors_generate_cpu<float>(sddk::matrix<std::complex<float>>&, sddk::mdarray<std::complex<float>, 3> const&,

        int, int, beta_chunk_t const&, Simulation_context const&, fft::Gvec const&);

#endif


template <class T>

void

beta_projectors_generate_gpu(beta_projectors_coeffs_t<T>& out,

        sddk::mdarray<std::complex<T>, 3> const& pw_coeffs_t_device,

        sddk::mdarray<std::complex<T>, 3> const& pw_coeffs_t_host, Simulation_context const& ctx,

                             fft::Gvec const& gkvec, sddk::mdarray<double, 2> const& gkvec_coord_,

                             beta_chunk_t const& beta_chunk, int j__)

{

    PROFILE("beta_projectors_generate_gpu");

#if defined(SIRIUS_GPU)

    int num_gkvec_loc = gkvec.count();

    auto& desc = beta_chunk.desc_;

    create_beta_gk_gpu(beta_chunk.num_atoms_, num_gkvec_loc, desc.at(sddk::memory_t::device),

                       pw_coeffs_t_device.at(sddk::memory_t::device, 0, 0, j__), gkvec_coord_.at(sddk::memory_t::device),

                       beta_chunk.atom_pos_.at(sddk::memory_t::device), out.pw_coeffs_a_.at(sddk::memory_t::device));

#endif

}


// explicit instantiation

template void

beta_projectors_generate_gpu<double>(beta_projectors_coeffs_t<double>&, sddk::mdarray<std::complex<double>, 3> const&,

        sddk::mdarray<std::complex<double>, 3> const&, Simulation_context const&, fft::Gvec const&,

        sddk::mdarray<double, 2> const&, beta_chunk_t const&, int);

#ifdef SIRIUS_USE_FP32

// explicit instantiation

template void

beta_projectors_generate_gpu<float>(beta_projectors_coeffs_t<float>&, sddk::mdarray<std::complex<float>, 3> const&,

        sddk::mdarray<std::complex<float>, 3> const&, Simulation_context const&, fft::Gvec const&,

        sddk::mdarray<double, 2> const&, beta_chunk_t const&, int);

#endif

} // namespace local


template <typename T>

void

Beta_projectors_base<T>::split_in_chunks()

{

    auto& uc = ctx_.unit_cell();


    std::vector<int> offset_t(uc.num_atom_types());

    std::generate(offset_t.begin(), offset_t.end(),

            [n = 0, iat = 0, &uc] () mutable

            {

                int offs = n;

                n += uc.atom_type(iat++).mt_basis_size();

                return offs;

            });


    if (uc.max_mt_basis_size() == 0) {

        /* no beta projectors at all */

        beta_chunks_  = std::vector<beta_chunk_t>(0);

        num_beta_t_   = 0;

        max_num_beta_ = 0;

        return;

    }


    /* initial chunk size */

    int chunk_size = std::min(uc.num_atoms(), ctx_.cfg().control().beta_chunk_size());

    /* maximum number of chunks */

    int num_chunks = uc.num_atoms() / chunk_size + std::min(1, uc.num_atoms() % chunk_size);

    /* final maximum chunk size */

    chunk_size = uc.num_atoms() / num_chunks + std::min(1, uc.num_atoms() % num_chunks);


    int offset_in_beta_gk{0};

    beta_chunks_ = std::vector<beta_chunk_t>(num_chunks);


    for (int ib = 0; ib < num_chunks; ib++) {

        /* number of atoms in this chunk */

        int na                      = std::min(uc.num_atoms(), (ib + 1) * chunk_size) - ib * chunk_size;

        beta_chunks_[ib].num_atoms_ = na;

        beta_chunks_[ib].desc_      = sddk::mdarray<int, 2>(4, na);

        beta_chunks_[ib].atom_pos_  = sddk::mdarray<double, 2>(3, na);


        int num_beta{0};

        for (int i = 0; i < na; i++) {

            /* global index of atom by local index and chunk */

            int ia     = ib * chunk_size + i;

            auto pos   = uc.atom(ia).position();

            auto& type = uc.atom(ia).type();

            /* atom fractional coordinates */

            for (int x : {0, 1, 2}) {

                beta_chunks_[ib].atom_pos_(x, i) = pos[x];

            }

            /* number of beta functions for atom */

            beta_chunks_[ib].desc_(beta_desc_idx::nbf, i) = type.mt_basis_size();

            /* offset in beta_gk*/

            beta_chunks_[ib].desc_(beta_desc_idx::offset, i) = num_beta;

            /* offset in beta_gk_t */

            beta_chunks_[ib].desc_(beta_desc_idx::offset_t, i) = offset_t[type.id()]; //offset_lo();

            /* global index of atom */

            beta_chunks_[ib].desc_(beta_desc_idx::ia, i) = ia;


            num_beta += type.mt_basis_size();

        }

        /* number of beta-projectors in this chunk */

        beta_chunks_[ib].num_beta_ = num_beta;

        beta_chunks_[ib].offset_   = offset_in_beta_gk;

        offset_in_beta_gk += num_beta;


        if (ctx_.processing_unit() == sddk::device_t::GPU) {

            beta_chunks_[ib].desc_.allocate(sddk::memory_t::device).copy_to(sddk::memory_t::device);

            beta_chunks_[ib].atom_pos_.allocate(sddk::memory_t::device).copy_to(sddk::memory_t::device);

        }

    }

    num_total_beta_ = offset_in_beta_gk;


    max_num_beta_ = 0;

    for (auto& e : beta_chunks_) {

        max_num_beta_ = std::max(max_num_beta_, e.num_beta_);

    }


    num_beta_t_ = 0;

    for (int iat = 0; iat < uc.num_atom_types(); iat++) {

        num_beta_t_ += uc.atom_type(iat).mt_basis_size();

    }

}


template <typename T>

Beta_projectors_base<T>::Beta_projectors_base(Simulation_context& ctx__, fft::Gvec const& gkvec__, int N__)

    : ctx_(ctx__)

    , gkvec_(gkvec__)

    , N_(N__)

{

    split_in_chunks();


    if (!num_beta_t()) {

        return;

    }


    /* allocate memory */

    pw_coeffs_t_ = sddk::mdarray<std::complex<T>, 3>(num_gkvec_loc(), num_beta_t(), N__, sddk::memory_t::host,

            "pw_coeffs_t_");


    if (ctx_.processing_unit() == sddk::device_t::GPU) {

        gkvec_coord_ = sddk::mdarray<double, 2>(3, num_gkvec_loc());

        gkvec_coord_.allocate(sddk::memory_t::device);

        /* copy G+k vectors */

        for (int igk_loc = 0; igk_loc < num_gkvec_loc(); igk_loc++) {

            auto vgk = gkvec_.template gkvec<index_domain_t::local>(igk_loc);

            for (auto x : {0, 1, 2}) {

                gkvec_coord_(x, igk_loc) = vgk[x];

            }

        }

        gkvec_coord_.copy_to(sddk::memory_t::device);

    }

}


template <class T>

void

Beta_projector_generator<T>::generate(beta_projectors_coeffs_t<T>& out, int ichunk__) const

{

    PROFILE("sirius::Beta_projector_generator");

    using numeric_t = std::complex<T>;


    int j{0};

    out.beta_chunk_ = beta_chunks_.at(ichunk__);


    auto num_beta = out.beta_chunk_.num_beta_;

    auto gk_size  = gkvec_.count();


    switch (processing_unit_) {

        case sddk::device_t::CPU: {

            out.pw_coeffs_a_ =

                sddk::matrix<numeric_t>(const_cast<numeric_t*>(&beta_pw_all_atoms_(0, beta_chunks_[ichunk__].offset_)),

                                  gk_size, beta_chunks_[ichunk__].num_beta_);

            break;

        }

        case sddk::device_t::GPU: {

            out.pw_coeffs_a_ =

                sddk::matrix<numeric_t>(nullptr, out.pw_coeffs_a_buffer_.device_data(), gk_size, num_beta);

            local::beta_projectors_generate_gpu(out, pw_coeffs_t_device_, pw_coeffs_t_host_, ctx_, gkvec_, gkvec_coord_,

                                                beta_chunks_[ichunk__], j);

            break;

        }

    }

}


template <class T>

void

Beta_projector_generator<T>::generate(beta_projectors_coeffs_t<T>& out, int ichunk__, int j__) const

{

    PROFILE("sirius::Beta_projector_generator");

    using numeric_t = std::complex<T>;


    out.beta_chunk_ = beta_chunks_.at(ichunk__);


    auto num_beta = out.beta_chunk_.num_beta_;

    auto gk_size  = gkvec_.count();


    switch (processing_unit_) {

        case sddk::device_t::CPU: {

            // allocate pw_coeffs_a

            out.pw_coeffs_a_ = sddk::matrix<numeric_t>(gk_size, num_beta, sddk::get_memory_pool(sddk::memory_t::host));

            local::beta_projectors_generate_cpu(out.pw_coeffs_a_, pw_coeffs_t_host_, ichunk__, j__,

                                                beta_chunks_[ichunk__], ctx_, gkvec_);

            break;

        }

        case sddk::device_t::GPU: {

            // view of internal buffer with correct number of cols (= num_beta)

            out.pw_coeffs_a_ =

                sddk::matrix<numeric_t>(nullptr, out.pw_coeffs_a_buffer_.device_data(), gk_size, num_beta);

            // g0 coefficients reside in host memory


            local::beta_projectors_generate_gpu(out, pw_coeffs_t_device_, pw_coeffs_t_host_, ctx_, gkvec_, gkvec_coord_,

                                                beta_chunks_[ichunk__], j__);

            break;

        }

    }

}


template class Beta_projector_generator<double>;

template class Beta_projectors_base<double>;

#ifdef SIRIUS_USE_FP32

template class Beta_projector_generator<float>;

template class Beta_projectors_base<float>;

#endif


} // namespace sirius

beta_projectors_base.hpp
Contains declaration and implementation of sirius::Beta_projectors_base class.

sirius::Beta_projectors_base
Base class for beta-projectors, gradient of beta-projectors and strain derivatives of beta-projectors...
Definition: beta_projectors_base.hpp:283

sirius::Beta_projectors_base::gkvec_
fft::Gvec const  & gkvec_
List of G+k vectors.
Definition: beta_projectors_base.hpp:288

sirius::Beta_projectors_base::gkvec_coord_
sddk::mdarray< double, 2 > gkvec_coord_
Coordinates of G+k vectors used by GPU kernel.
Definition: beta_projectors_base.hpp:291

sirius::Beta_projectors_base::pw_coeffs_t_
sddk::mdarray< std::complex< T >, 3 > pw_coeffs_t_
Phase-factor independent coefficients of |beta> functions for atom types.
Definition: beta_projectors_base.hpp:297

sirius::Beta_projectors_base::split_in_chunks
void split_in_chunks()
Split beta-projectors into chunks.
Definition: beta_projectors_base.cpp:139

sirius::Simulation_context
Simulation context is a set of parameters and objects describing a single simulation.
Definition: simulation_context.hpp:183

sirius::Simulation_context::gvec_phase_factor
auto gvec_phase_factor(r3::vector< int > G__, int ia__) const
Phase factors .
Definition: simulation_context.hpp:552

sirius::fft::Gvec
A set of G-vectors for FFTs and G+k basis functions.
Definition: gvec.hpp:130

sirius::fft::Gvec::count
int count() const
Number of G-vectors for a fine-grained distribution for the current MPI rank.
Definition: gvec.hpp:506

sirius::fft::Gvec::gvec
r3::vector< int > gvec(int ig__) const
Return G vector in fractional coordinates.
Definition: gvec.hpp:540

sirius::sddk::mdarray< T, 2 >

sirius::sddk::mdarray::copy_to
void copy_to(memory_t mem__, size_t idx0__, size_t n__, acc::stream_id sid=acc::stream_id(-1))
Copy n elements starting from idx0 from one memory type to another.
Definition: memory.hpp:1339

sirius::sddk::mdarray::allocate
mdarray< T, N > & allocate(memory_t memory__)
Allocate memory for array.
Definition: memory.hpp:1057

env.hpp
Get the environment variables.

linalg_base.hpp
Basic interface to linear algebra functions.

sirius
Namespace of the SIRIUS library.
Definition: sirius.f90:5

sirius::index_domain_t::local
@ local
Local index.

sirius::twopi
const double twopi
Definition: constants.hpp:45

sirius::conj
auto conj(double x__)
Return complex conjugate of a number. For a real value this is the number itself.
Definition: math_tools.hpp:165

profiler.hpp
A time-based profiler.

sirius::beta_chunk_t
Describe chunk of beta-projectors for a block of atoms.
Definition: beta_projectors_base.hpp:64

sirius::beta_chunk_t::desc_
sddk::mdarray< int, 2 > desc_
Descriptor of block of beta-projectors for an atom.
Definition: beta_projectors_base.hpp:72

sirius::beta_chunk_t::num_atoms_
int num_atoms_
Number of atoms in the current chunk.
Definition: beta_projectors_base.hpp:68

sirius::beta_chunk_t::atom_pos_
sddk::mdarray< double, 2 > atom_pos_
Positions of atoms.
Definition: beta_projectors_base.hpp:74

sirius::beta_desc_idx::ia
static const int ia
Global index of atom.
Definition: beta_projectors_base.hpp:58

sirius::beta_desc_idx::nbf
static const int nbf
Number of beta-projector functions for this atom.
Definition: beta_projectors_base.hpp:52

sirius::beta_desc_idx::offset
static const int offset
Offset of beta-projectors in this chunk.
Definition: beta_projectors_base.hpp:54

sirius::beta_desc_idx::offset_t
static const int offset_t
Offset of beta-projectors in the array for atom types.
Definition: beta_projectors_base.hpp:56

sirius::beta_projectors_coeffs_t
Stores a chunk of the beta-projector and metadata.
Definition: beta_projectors_base.hpp:116

wave_functions.hpp
Contains declaration and implementation of Wave_functions class.