d6/de3/BFieldCache_8cxx_source.html

/*

  Copyright (C) 2002-2024 CERN for the benefit of the ATLAS collaboration

*/


#include "MagFieldElements/BFieldCache.h"

#include "CxxUtils/vec.h"

#include "CxxUtils/features.h"

#include <cmath>


namespace {

#if HAVE_TARGET_CLONES

[[gnu::target_clones("avx2","default")]]

#endif

void getBzrphi(double Bzrphi[4],

               const double field[3][8],

               const double fz,

               const double gz,

               const double fr,

               const double gr,

               const double fphi,

               const double gphi,

               const double scale) {

  /*

   The following implement this  calculation

   const double* field = m_field[i];

   Bzrphi[i] = scale * (gz * ( gr * (gphi * field[0] + fphi * field[4]) +

                               fr * (gphi * field[1] + fphi * field[5])) +

                         fz * (gr * (gphi * field[2] + fphi * field[6]) +

                               fr * (gphi * field[3] + fphi * field[7])));

  in SIMD fashion.

  The "lanes"  are

  ( field[0], field[1], field[2], field[3])

  ( field[4], field[5], field[6], field[7])

  aka the "vertical" part of the inermost parenthesis.


  Then we work our way out. Following the formula in a "vertical"

  manner.


  The following code keeps the same order as operation as the

  above formula. As we want identical results.

  */

  CxxUtils::vec<double, 4> rInterCoeff = {gr, fr, gr, fr};

  // Load  Bz at 8 corners of the bin

  CxxUtils::vec<double, 4> field1_z = {field[0][0], field[0][1], field[0][2],

                                       field[0][3]};

  CxxUtils::vec<double, 4> field2_z = {field[0][4], field[0][5], field[0][6],

                                       field[0][7]};

  // Load Br at 8 corners of the bin

  CxxUtils::vec<double, 4> field1_r = {field[1][0], field[1][1], field[1][2],

                                       field[1][3]};

  CxxUtils::vec<double, 4> field2_r = {field[1][4], field[1][5], field[1][6],

                                       field[1][7]};

  // Load Bphi at 8 corners of the bin

  CxxUtils::vec<double, 4> field1_phi = {field[2][0], field[2][1], field[2][2],

                                         field[2][3]};

  CxxUtils::vec<double, 4> field2_phi = {field[2][4], field[2][5], field[2][6],

                                         field[2][7]};


  CxxUtils::vec<double, 4> gPhiM_z = field1_z * gphi;

  CxxUtils::vec<double, 4> fPhiM_z = field2_z * fphi;

  CxxUtils::vec<double, 4> interp_z = (gPhiM_z + fPhiM_z) * rInterCoeff;


  CxxUtils::vec<double, 4> gPhiM_r = field1_r * gphi;

  CxxUtils::vec<double, 4> fPhiM_r = field2_r * fphi;

  CxxUtils::vec<double, 4> interp_r = (gPhiM_r + fPhiM_r) * rInterCoeff;


  CxxUtils::vec<double, 4> gPhiM_phi = field1_phi * gphi;

  CxxUtils::vec<double, 4> fPhiM_phi = field2_phi * fphi;

  CxxUtils::vec<double, 4> interp_phi = (gPhiM_phi + fPhiM_phi) * rInterCoeff;


  //  We end up with

  //  3 (z,r,phi) size 4 SIMD vectors :

  //  The entries of each of the 3 SIMD vectors are :

  //  0 : gr * (gphi * field[0] + fphi * field[4]) ,

  //  1 : fr * (gphi * field[1] + fphi * field[5]) ,

  //  2 : gr * (gphi * field[2] + fphi * field[6]) ,

  //  3 : fr * (gphi * field[3] + fphi * field[7]) ,


  // Switch to 4 vector of 3 entries (z,r,phi)

  CxxUtils::vec<double, 4> Bzrphivec0 = {interp_z[0], interp_r[0],

                                         interp_phi[0], 0};

  CxxUtils::vec<double, 4> Bzrphivec1 = {interp_z[1], interp_r[1],

                                         interp_phi[1], 0};

  CxxUtils::vec<double, 4> Bzrphivec2 = {interp_z[2], interp_r[2],

                                         interp_phi[2], 0};

  CxxUtils::vec<double, 4> Bzrphivec3 = {interp_z[3], interp_r[3],

                                         interp_phi[3], 0};


  // Do the final step for all 3 Bz,Br,Bphi at once

  CxxUtils::vec<double, 4> Bzrphi1 = (Bzrphivec0 + Bzrphivec1) * gz;

  CxxUtils::vec<double, 4> Bzrphi2 = (Bzrphivec2 + Bzrphivec3) * fz;

  // now create the final (r,z,phi) values in one pass

  CxxUtils::vec<double, 4> BzrphiV = (Bzrphi1 + Bzrphi2) * scale;

  CxxUtils::vstore(Bzrphi, BzrphiV);

}

}  // namespace


void


BFieldCache::getB(const double* ATH_RESTRICT xyz,

                  double r,

                  double phi,

                  double* ATH_RESTRICT B,

                  double* ATH_RESTRICT deriv) const {


  const double x = xyz[0];

  const double y = xyz[1];

  const double z = xyz[2];


  // make sure phi is inside [m_phimin,m_phimax]

  if (phi < m_phimin) {

    phi += 2 * M_PI;

  }

  // fractional position inside this bin

  const double fz = (z - m_zmin) * m_invz;

  const double gz = 1.0 - fz;

  const double fr = (r - m_rmin) * m_invr;

  const double gr = 1.0 - fr;

  const double fphi = (phi - m_phimin) * m_invphi;

  const double gphi = 1.0 - fphi;


  // get B in Z,r,phi

  double Bzrphi[4];

  getBzrphi(Bzrphi, m_field, fz, gz, fr, gr, fphi, gphi, m_scale);

  // convert (Bz,Br,Bphi) to (Bx,By,Bz)

  double invr;

  double c;

  double s;

  if (r > 0.0) {

    invr = 1.0 / r;

    c = x * invr;

    s = y * invr;

  } else {

    invr = 0.0;

    c = cos(m_phimin);

    s = sin(m_phimin);

  }

  B[0] = Bzrphi[1] * c - Bzrphi[2] * s;

  B[1] = Bzrphi[1] * s + Bzrphi[2] * c;

  B[2] = Bzrphi[0];


  // compute field derivatives if requested

  if (deriv) {

    const double sz = m_scale * m_invz;

    const double sr = m_scale * m_invr;

    const double sphi = m_scale * m_invphi;


    std::array<double, 3> dBdz{};

    std::array<double, 3> dBdr{};

    std::array<double, 3> dBdphi{};


    for (int j = 0; j < 3; ++j) { // Bz, Br, Bphi components

      const double* field = m_field[j];

      dBdz[j] =

        sz *

        (gr * (gphi * (field[2] - field[0]) + fphi * (field[6] - field[4])) +

         fr * (gphi * (field[3] - field[1]) + fphi * (field[7] - field[5])));

      dBdr[j] =

        sr *

        (gz * (gphi * (field[1] - field[0]) + fphi * (field[5] - field[4])) +

         fz * (gphi * (field[3] - field[2]) + fphi * (field[7] - field[6])));

      dBdphi[j] =

        sphi * (gz * (gr * (field[4] - field[0]) + fr * (field[5] - field[1])) +

                fz * (gr * (field[6] - field[2]) + fr * (field[7] - field[3])));

    }


    // convert to cartesian coordinates

    const double cc = c * c;

    const double cs = c * s;

    const double ss = s * s;

    const double ccinvr = cc * invr;

    const double csinvr = cs * invr;

    const double ssinvr = ss * invr;

    const double sinvr = s * invr;

    const double cinvr = c * invr;

    deriv[0] = cc * dBdr[1] - cs * dBdr[2] - csinvr * dBdphi[1] +

               ssinvr * dBdphi[2] + sinvr * B[1];

    deriv[1] = cs * dBdr[1] - ss * dBdr[2] + ccinvr * dBdphi[1] -

               csinvr * dBdphi[2] - cinvr * B[1];

    deriv[2] = c * dBdz[1] - s * dBdz[2];

    deriv[3] = cs * dBdr[1] + cc * dBdr[2] - ssinvr * dBdphi[1] -

               csinvr * dBdphi[2] - sinvr * B[0];

    deriv[4] = ss * dBdr[1] + cs * dBdr[2] + csinvr * dBdphi[1] +

               ccinvr * dBdphi[2] + cinvr * B[0];

    deriv[5] = s * dBdz[1] + c * dBdz[2];

    deriv[6] = c * dBdr[0] - sinvr * dBdphi[0];

    deriv[7] = s * dBdr[0] + cinvr * dBdphi[0];

    deriv[8] = dBdz[0];

  }

}


M_PI
#define M_PI
Definition ActiveFraction.h:11

phi
Scalar phi() const
phi method
Definition AmgMatrixBasePlugin.h:67

BFieldCache.h

gr
#define gr

sz
static Double_t sz
Definition LArPhysWaveHECTool.cxx:37

ss
static Double_t ss
Definition LArPhysWaveHECTool.cxx:37

y
#define y

xyz
#define xyz

x
#define x

z
#define z

BFieldCache::m_field
double m_field[3][8]
Definition BFieldCache.h:74

BFieldCache::m_invphi
double m_invphi
Definition BFieldCache.h:72

BFieldCache::m_rmin
double m_rmin
Definition BFieldCache.h:64

BFieldCache::m_phimin
double m_phimin
Definition BFieldCache.h:67

BFieldCache::getB
void getB(const double *ATH_RESTRICT xyz, double r, double phi, double *ATH_RESTRICT B, double *ATH_RESTRICT deriv=nullptr) const
Definition BFieldCache.cxx:99

BFieldCache::m_invr
double m_invr
Definition BFieldCache.h:71

BFieldCache::m_zmin
double m_zmin
Definition BFieldCache.h:61

BFieldCache::m_scale
double m_scale
Definition BFieldCache.h:73

BFieldCache::m_invz
double m_invz
Definition BFieldCache.h:70

features.h
Some additional feature test macros.

r
int r
Definition globals.cxx:22

CxxUtils::vec
typename vecDetail::vec_typedef< T, N >::type vec
Define a nice alias for the vectorized type.
Definition vec.h:207

CxxUtils::vstore
ATH_ALWAYS_INLINE void vstore(vec_type_t< VEC > *dst, const VEC &src)
Definition vec.h:290

ReadOfcFromCrest.field
int field
Definition ReadOfcFromCrest.py:52

grepfile.fr
fr
Definition grepfile.py:32

ATH_RESTRICT
#define ATH_RESTRICT
Definition restrict.h:31

vec.h
Vectorization helpers.