d5/dd5/s__u__operator_8cpp_source.html

#include "non_local_operator.hpp"


namespace sirius {


template <class T>

U_operator<T>::U_operator(Simulation_context const& ctx__, Hubbard_matrix const& um1__, std::array<double, 3> vk__)

    : ctx_(ctx__)

    , vk_(vk__)

{

    if (!ctx_.hubbard_correction()) {

        return;

    }

    /* a pair of "total number, offests" for the Hubbard orbitals idexing */

    auto r                 = ctx_.unit_cell().num_hubbard_wf();

    this->nhwf_            = r.first;

    this->offset_          = um1__.offset();

    this->atomic_orbitals_ = um1__.atomic_orbitals();

    for (int j = 0; j < ctx_.num_mag_dims() + 1; j++) {

        um_[j] = la::dmatrix<std::complex<T>>(r.first, r.first);

        um_[j].zero();

    }


    /* copy local blocks */

    for (int at_lvl = 0; at_lvl < static_cast<int>(um1__.atomic_orbitals().size()); at_lvl++) {

        const int ia    = um1__.atomic_orbitals(at_lvl).first;

        auto& atom_type = ctx_.unit_cell().atom(ia).type();

        int lo_ind      = um1__.atomic_orbitals(at_lvl).second;

        if (atom_type.lo_descriptor_hub(lo_ind).use_for_calculation()) {

            int lmmax_at = 2 * atom_type.lo_descriptor_hub(lo_ind).l() + 1;

            for (int j = 0; j < ctx_.num_mag_dims() + 1; j++) {

                for (int m2 = 0; m2 < lmmax_at; m2++) {

                    for (int m1 = 0; m1 < lmmax_at; m1++) {

                        um_[j](um1__.offset(at_lvl) + m1, um1__.offset(at_lvl) + m2) = um1__.local(at_lvl)(m1, m2, j);

                    }

                }

            }

        }

    }


    for (int i = 0; i < ctx_.cfg().hubbard().nonlocal().size(); i++) {

        auto nl = ctx_.cfg().hubbard().nonlocal(i);

        int ia  = nl.atom_pair()[0];

        int ja  = nl.atom_pair()[1];

        int il  = nl.l()[0];

        int jl  = nl.l()[1];

        auto Tr = nl.T();


        /* we need to find the index of the radial function corresponding to the atomic level of each atom.  */

        int at1_lvl = um1__.find_orbital_index(ia, nl.n()[0], il);

        int at2_lvl = um1__.find_orbital_index(ja, nl.n()[1], jl);


        auto z1 = std::exp(std::complex<double>(0, twopi * dot(vk_, r3::vector<int>(Tr))));

        for (int is = 0; is < ctx_.num_spins(); is++) {

            for (int m1 = 0; m1 < 2 * il + 1; m1++) {

                for (int m2 = 0; m2 < 2 * jl + 1; m2++) {

                    um_[is](um1__.offset(at1_lvl) + m1, um1__.offset(at2_lvl) + m2) +=

                        z1 * um1__.nonlocal(i)(m1, m2, is);

                }

            }

        }

    }

    for (int is = 0; is < ctx_.num_spins(); is++) {

        auto diff = check_hermitian(um_[is], r.first);

        if (diff > 1e-10) {

            RTE_THROW("um is not Hermitian");

        }

        if (env::print_checksum()) {

            print_checksum("um" + std::to_string(is), um_[is].checksum(r.first, r.first), RTE_OUT(ctx_.out()));

        }

        if (ctx_.processing_unit() == sddk::device_t::GPU) {

            um_[is].allocate(get_memory_pool(sddk::memory_t::device)).copy_to(sddk::memory_t::device);

        }

    }

}


template <class T>

int

U_operator<T>::find_orbital_index(const int ia__, const int n__, const int l__) const

{

    int at_lvl = 0;

    for (at_lvl = 0; at_lvl < static_cast<int>(atomic_orbitals_.size()); at_lvl++) {

        int lo_ind  = atomic_orbitals_[at_lvl].second;

        int atom_id = atomic_orbitals_[at_lvl].first;

        if ((atomic_orbitals_[at_lvl].first == ia__) &&

            (ctx_.unit_cell().atom(atom_id).type().lo_descriptor_hub(lo_ind).n() == n__) &&

            (ctx_.unit_cell().atom(atom_id).type().lo_descriptor_hub(lo_ind).l() == l__))

            break;

    }


    if (at_lvl == static_cast<int>(atomic_orbitals_.size())) {

        std::cout << "atom: " << ia__ << "n: " << n__ << ", l: " << l__ << std::endl;

        RTE_THROW("Found an arbital that is not listed\n");

    }

    return at_lvl;

}


template class U_operator<double>;

#if defined(SIRIUS_USE_FP32)

template class U_operator<float>;

#endif


/** Apply Hubbard U correction

 * \tparam T  Precision type of wave-functions (flat or double).

 * \param [in]  hub_wf   Hubbard atomic wave-functions.

 * \param [in]  phi      Set of wave-functions to which Hubbard correction is applied.

 * \param [out] hphi     Output wave-functions to which the result is added.

 */

template <typename T>

void

apply_U_operator(Simulation_context& ctx__, wf::spin_range spins__, wf::band_range br__,

                 wf::Wave_functions<T> const& hub_wf__, wf::Wave_functions<T> const& phi__, U_operator<T> const& um__,

                 wf::Wave_functions<T>& hphi__)

{

    if (!ctx__.hubbard_correction()) {

        return;

    }


    la::dmatrix<std::complex<T>> dm(hub_wf__.num_wf().get(), br__.size());


    auto mt = ctx__.processing_unit_memory_t();

    auto la = la::lib_t::blas;

    if (is_device_memory(mt)) {

        la = la::lib_t::gpublas;

        dm.allocate(mt);

    }


    /* First calculate the local part of the projections

       dm(i, n) = <phi_i| S |psi_{nk}> */

    wf::inner(ctx__.spla_context(), mt, spins__, hub_wf__, wf::band_range(0, hub_wf__.num_wf().get()), phi__, br__, dm,

              0, 0);


    la::dmatrix<std::complex<T>> Up(hub_wf__.num_wf().get(), br__.size());

    if (is_device_memory(mt)) {

        Up.allocate(mt);

    }


    if (ctx__.num_mag_dims() == 3) {

        Up.zero();

        #pragma omp parallel for schedule(static)

        for (int at_lvl = 0; at_lvl < (int)um__.atomic_orbitals().size(); at_lvl++) {

            const int ia     = um__.atomic_orbitals(at_lvl).first;

            auto const& atom = ctx__.unit_cell().atom(ia);

            if (atom.type().lo_descriptor_hub(um__.atomic_orbitals(at_lvl).second).use_for_calculation()) {

                const int lmax_at = 2 * atom.type().lo_descriptor_hub(um__.atomic_orbitals(at_lvl).second).l() + 1;

                // we apply the hubbard correction. For now I have no papers

                // giving me the formula for the SO case so I rely on QE for it

                // but I do not like it at all

                for (int s1 = 0; s1 < ctx__.num_spins(); s1++) {

                    for (int s2 = 0; s2 < ctx__.num_spins(); s2++) {

                        // TODO: replace this with matrix matrix multiplication

                        for (int nbd = 0; nbd < br__.size(); nbd++) {

                            for (int m1 = 0; m1 < lmax_at; m1++) {

                                for (int m2 = 0; m2 < lmax_at; m2++) {

                                    const int ind = (s1 == s2) * s1 + (1 + 2 * s2 + s1) * (s1 != s2);

                                    Up(um__.nhwf() * s1 + um__.offset(at_lvl) + m1, nbd) +=

                                        um__(um__.offset(at_lvl) + m2, um__.offset(at_lvl) + m1, ind) *

                                        dm(um__.nhwf() * s2 + um__.offset(at_lvl) + m2, nbd);

                                }

                            }

                        }

                    }

                }

            }

        }

    } else {

        la::wrap(la).gemm('N', 'N', um__.nhwf(), br__.size(), um__.nhwf(), &la::constant<std::complex<T>>::one(),

                          um__.at(mt, 0, 0, spins__.begin().get()), um__.nhwf(), dm.at(mt, 0, 0), dm.ld(),

                          &la::constant<std::complex<T>>::zero(), Up.at(mt, 0, 0), Up.ld());

        if (is_device_memory(mt)) {

            Up.copy_to(sddk::memory_t::host);

        }

    }

    for (auto s = spins__.begin(); s != spins__.end(); s++) {

        auto sp = hub_wf__.actual_spin_index(s);

        auto sp1 = hphi__.actual_spin_index(s);

        wf::transform(ctx__.spla_context(), mt, Up, 0, 0, 1.0, hub_wf__, sp, wf::band_range(0, hub_wf__.num_wf().get()),

                      1.0, hphi__, sp1, br__);

    }

}


template void apply_U_operator<double>(Simulation_context&, wf::spin_range, wf::band_range,

                                       const wf::Wave_functions<double>&, const wf::Wave_functions<double>&,

                                       U_operator<double> const&, wf::Wave_functions<double>&);


#ifdef SIRIUS_USE_FP32

template void apply_U_operator<float>(Simulation_context&, wf::spin_range, wf::band_range,

                                      const wf::Wave_functions<float>&, const wf::Wave_functions<float>&,

                                      U_operator<float> const&, wf::Wave_functions<float>&);

#endif


/// Apply strain derivative of S-operator to all scalar functions.

void

apply_S_operator_strain_deriv(sddk::memory_t mem__, int comp__, Beta_projector_generator<double>& bp__,

                              beta_projectors_coeffs_t<double>& bp_coeffs__,

                              Beta_projector_generator<double>& bp_strain_deriv__,

                              beta_projectors_coeffs_t<double>& bp_strain_deriv_coeffs__,

                              wf::Wave_functions<double>& phi__, Q_operator<double>& q_op__,

                              wf::Wave_functions<double>& ds_phi__)

{

    if (sddk::is_device_memory(mem__)) {

        RTE_ASSERT((bp__.device_t() == sddk::device_t::GPU));

    }

    // NOTE: Beta_projectors_generator knows the target memory!

    using complex_t = std::complex<double>;


    RTE_ASSERT(ds_phi__.num_wf() == phi__.num_wf());

    for (int ichunk = 0; ichunk < bp__.num_chunks(); ichunk++) {

        /* generate beta-projectors for a block of atoms */

        bp__.generate(bp_coeffs__, ichunk);

        /* generate derived beta-projectors for a block of atoms */

        bp_strain_deriv__.generate(bp_strain_deriv_coeffs__, ichunk, comp__);


        auto host_mem         = bp__.ctx().host_memory_t();

        auto& spla_ctx        = bp__.ctx().spla_context();

        auto band_range_phi   = wf::band_range(0, phi__.num_wf().get());

        bool result_on_device = bp__.ctx().processing_unit() == sddk::device_t::GPU;

        auto dbeta_phi        = inner_prod_beta<complex_t>(spla_ctx, mem__, host_mem, result_on_device,

                                                    bp_strain_deriv_coeffs__, phi__, wf::spin_index(0), band_range_phi);

        auto beta_phi = inner_prod_beta<complex_t>(spla_ctx, mem__, host_mem, result_on_device, bp_coeffs__, phi__,

                                                   wf::spin_index(0), band_range_phi);


        auto band_range = wf::band_range(0, ds_phi__.num_wf().get());

        q_op__.apply(mem__, ichunk, 0, ds_phi__, band_range, bp_coeffs__, dbeta_phi);

        q_op__.apply(mem__, ichunk, 0, ds_phi__, band_range, bp_strain_deriv_coeffs__, beta_phi);

    }

}


} // namespace sirius

sirius::Beta_projector_generator
Definition: beta_projectors_base.hpp:175

sirius::Non_local_operator::apply
void apply(sddk::memory_t mem__, int chunk__, int ispn_block__, wf::Wave_functions< T > &op_phi__, wf::band_range br__, beta_projectors_coeffs_t< T > const &beta_coeffs__, sddk::matrix< F > const &beta_phi__) const
Apply chunk of beta-projectors to all wave functions.
Definition: non_local_operator_base.hpp:125

sirius::Q_operator< double >

sirius::Simulation_context
Simulation context is a set of parameters and objects describing a single simulation.
Definition: simulation_context.hpp:183

sirius::Simulation_context::processing_unit_memory_t
auto processing_unit_memory_t() const
Return the memory type for processing unit.
Definition: simulation_context.hpp:622

sirius::Simulation_context::host_memory_t
auto host_memory_t() const
Type of the host memory for arrays used in linear algebra operations.
Definition: simulation_context.hpp:616

sirius::Simulation_parameters::num_spins
int num_spins() const
Number of spin components.
Definition: simulation_parameters.hpp:266

sirius::Simulation_parameters::num_mag_dims
int num_mag_dims() const
Number of dimensions in the magnetization vector.
Definition: simulation_parameters.hpp:256

sirius::U_operator
Definition: non_local_operator.hpp:64

sirius::la::dmatrix
Distributed matrix.
Definition: dmatrix.hpp:56

sirius::la::wrap
Definition: linalg.hpp:62

sirius::la::wrap::gemm
void gemm(char transa, char transb, ftn_int m, ftn_int n, ftn_int k, T const *alpha, T const *A, ftn_int lda, T const *B, ftn_int ldb, T const *beta, T *C, ftn_int ldc, acc::stream_id sid=acc::stream_id(-1)) const
General matrix-matrix multiplication.

sirius::sddk::mdarray::zero
void zero(memory_t mem__, size_t idx0__, size_t n__)
Zero n elements starting from idx0.
Definition: memory.hpp:1316

sirius::sddk::mdarray::ld
uint32_t ld() const
Return leading dimension size.
Definition: memory.hpp:1233

sirius::sddk::mdarray::allocate
mdarray< T, N > & allocate(memory_t memory__)
Allocate memory for array.
Definition: memory.hpp:1057

sirius::strong_type< int, struct __spin_index_tag >

sirius::wf::Wave_functions_base::num_wf
auto num_wf() const
Return number of wave-functions.
Definition: wave_functions.hpp:395

sirius::wf::Wave_functions_base::actual_spin_index
auto actual_spin_index(spin_index s__) const
Return the actual spin index of the wave-functions.
Definition: wave_functions.hpp:408

sirius::wf::Wave_functions
Wave-functions representation.
Definition: wave_functions.hpp:691

sirius::wf::band_range
Describe a range of bands.
Definition: wave_functions.hpp:130

sirius::wf::spin_range
Describe a range of spins.
Definition: wave_functions.hpp:170

sirius::sddk::is_device_memory
bool is_device_memory(memory_t mem__)
Check if this is a valid device memory (memory, accessible by the device).
Definition: memory.hpp:93

sirius::sddk::memory_t
memory_t
Memory types where the code can store data.
Definition: memory.hpp:71

sirius::acc::zero
void zero(T *ptr__, size_t n__)
Zero the device memory.
Definition: acc.hpp:397

sirius::wf::inner
std::enable_if_t< std::is_same< T, real_type< F > >::value, void > inner(::spla::Context &spla_ctx__, sddk::memory_t mem__, spin_range spins__, W const &wf_i__, band_range br_i__, Wave_functions< T > const &wf_j__, band_range br_j__, la::dmatrix< F > &result__, int irow0__, int jcol0__)
Compute inner product between the two sets of wave-functions.
Definition: wave_functions.hpp:1622

sirius::wf::transform
std::enable_if_t< std::is_same< T, real_type< F > >::value, void > transform(::spla::Context &spla_ctx__, sddk::memory_t mem__, la::dmatrix< F > const &M__, int irow0__, int jcol0__, real_type< F > alpha__, Wave_functions< T > const &wf_in__, spin_index s_in__, band_range br_in__, real_type< F > beta__, Wave_functions< T > &wf_out__, spin_index s_out__, band_range br_out__)
Apply linear transformation to the wave-functions.
Definition: wave_functions.hpp:1490

sirius
Namespace of the SIRIUS library.
Definition: sirius.f90:5

sirius::apply_U_operator
void apply_U_operator(Simulation_context &ctx__, wf::spin_range spins__, wf::band_range br__, wf::Wave_functions< T > const &hub_wf__, wf::Wave_functions< T > const &phi__, U_operator< T > const &um__, wf::Wave_functions< T > &hphi__)
Definition: s_u_operator.cpp:110

sirius::apply_S_operator_strain_deriv
void apply_S_operator_strain_deriv(sddk::memory_t mem__, int comp__, Beta_projector_generator< double > &bp__, beta_projectors_coeffs_t< double > &bp_coeffs__, Beta_projector_generator< double > &bp_strain_deriv__, beta_projectors_coeffs_t< double > &bp_strain_deriv_coeffs__, wf::Wave_functions< double > &phi__, Q_operator< double > &q_op__, wf::Wave_functions< double > &ds_phi__)
Apply strain derivative of S-operator to all scalar functions.
Definition: s_u_operator.cpp:193

non_local_operator.hpp
Contains declaration of sirius::Non_local_operator class.

sirius::beta_projectors_coeffs_t
Stores a chunk of the beta-projector and metadata.
Definition: beta_projectors_base.hpp:116

sirius::la::constant
Definition: linalg_base.hpp:42