mirror of
https://github.com/vale981/arb
synced 2025-03-05 09:21:38 -05:00
slight speedup of Legendre polynomials
This commit is contained in:
parent
0346fe4df7
commit
ac044b4e29
5 changed files with 150 additions and 147 deletions
|
@ -11,60 +11,77 @@
|
||||||
|
|
||||||
#include "arb_hypgeom.h"
|
#include "arb_hypgeom.h"
|
||||||
|
|
||||||
#define BIG (1 << (FLINT_BITS / 2 - 2))
|
#define UNROLL 4
|
||||||
|
|
||||||
static void PP(fmpz_t res, ulong n, slong k)
|
|
||||||
{
|
|
||||||
/* (2 * k - 1) * (2 * k - 1) */
|
|
||||||
if (k < BIG)
|
|
||||||
{
|
|
||||||
fmpz_set_ui(res, (2 * k - 1) * (2 * k - 1));
|
|
||||||
}
|
|
||||||
else
|
|
||||||
{
|
|
||||||
fmpz_set_ui(res, 2 * k - 1);
|
|
||||||
fmpz_mul_ui(res, res, 2 * k - 1);
|
|
||||||
}
|
|
||||||
}
|
|
||||||
|
|
||||||
static void QQ(fmpz_t res, ulong n, slong k)
|
|
||||||
{
|
|
||||||
if (k < BIG && n < BIG)
|
|
||||||
{
|
|
||||||
fmpz_set_ui(res, k * (2 * k + 2 * n + 1));
|
|
||||||
}
|
|
||||||
else
|
|
||||||
{
|
|
||||||
fmpz_set_ui(res, n);
|
|
||||||
fmpz_mul_2exp(res, res, 1);
|
|
||||||
fmpz_add_ui(res, res, 2 * k + 1);
|
|
||||||
fmpz_mul_ui(res, res, k);
|
|
||||||
}
|
|
||||||
}
|
|
||||||
|
|
||||||
static void
|
static void
|
||||||
asymp_series(acb_t res, ulong n, acb_srcptr xpow, slong m, slong K, slong prec)
|
asymp_series(acb_t res, ulong n, acb_srcptr xpow, slong m, slong K, slong prec)
|
||||||
{
|
{
|
||||||
slong j, k, khi, klo, u, r;
|
slong j, k, khi, klo, u, r;
|
||||||
|
fmpz * c;
|
||||||
acb_t s;
|
acb_t s;
|
||||||
fmpz_t cc, dd;
|
|
||||||
|
|
||||||
acb_init(s);
|
acb_init(s);
|
||||||
fmpz_init(cc);
|
c = _fmpz_vec_init(UNROLL + 1);
|
||||||
fmpz_init(dd);
|
|
||||||
|
|
||||||
k = K - 1;
|
k = K - 1;
|
||||||
while (k >= 1)
|
while (k >= 1)
|
||||||
{
|
{
|
||||||
u = FLINT_MIN(5, k);
|
u = FLINT_MIN(UNROLL, k);
|
||||||
|
|
||||||
khi = k;
|
khi = k;
|
||||||
klo = k - u + 1;
|
klo = k - u + 1;
|
||||||
|
|
||||||
PP(cc, n, khi);
|
for (j = klo; j <= khi; j++)
|
||||||
for (j = klo; j < khi; j++)
|
|
||||||
{
|
{
|
||||||
PP(dd, n, j);
|
ulong aa = (2 * j - 1);
|
||||||
fmpz_mul(cc, cc, dd);
|
ulong bb = (2 * j - 1);
|
||||||
|
|
||||||
|
if (j == klo)
|
||||||
|
fmpz_ui_mul_ui(c + khi - j, aa, bb);
|
||||||
|
else
|
||||||
|
fmpz_mul2_uiui(c + khi - j, c + khi - j + 1, aa, bb);
|
||||||
|
}
|
||||||
|
|
||||||
|
for (j = khi; j >= klo; j--)
|
||||||
|
{
|
||||||
|
ulong aa = (j);
|
||||||
|
ulong bb = (2 * j + 2 * n + 1);
|
||||||
|
|
||||||
|
if (n < UWORD_MAX / 8)
|
||||||
|
{
|
||||||
|
if (j == khi)
|
||||||
|
{
|
||||||
|
fmpz_ui_mul_ui(c + u, aa, bb);
|
||||||
|
}
|
||||||
|
else
|
||||||
|
{
|
||||||
|
fmpz_mul(c + khi - j, c + khi - j, c + u);
|
||||||
|
fmpz_mul2_uiui(c + u, c + u, aa, bb);
|
||||||
|
}
|
||||||
|
}
|
||||||
|
else
|
||||||
|
{
|
||||||
|
fmpz_t t;
|
||||||
|
fmpz_init(t);
|
||||||
|
|
||||||
|
fmpz_set_ui(t, n);
|
||||||
|
fmpz_add_ui(t, t, j);
|
||||||
|
fmpz_mul_2exp(t, t, 1);
|
||||||
|
fmpz_add_ui(t, t, 1);
|
||||||
|
|
||||||
|
if (j == khi)
|
||||||
|
{
|
||||||
|
fmpz_mul_ui(c + u, t, aa);
|
||||||
|
}
|
||||||
|
else
|
||||||
|
{
|
||||||
|
fmpz_mul(c + khi - j, c + khi - j, c + u);
|
||||||
|
fmpz_mul_ui(t, t, aa);
|
||||||
|
fmpz_mul(c + u, c + u, t);
|
||||||
|
}
|
||||||
|
|
||||||
|
fmpz_clear(t);
|
||||||
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
while (k >= klo)
|
while (k >= klo)
|
||||||
|
@ -74,36 +91,30 @@ asymp_series(acb_t res, ulong n, acb_srcptr xpow, slong m, slong K, slong prec)
|
||||||
if (k == khi)
|
if (k == khi)
|
||||||
{
|
{
|
||||||
acb_add(s, s, xpow + r, prec);
|
acb_add(s, s, xpow + r, prec);
|
||||||
acb_mul_fmpz(s, s, cc, prec);
|
acb_mul_fmpz(s, s, c + khi - k, prec);
|
||||||
}
|
}
|
||||||
else if (r == 0)
|
else if (r == 0)
|
||||||
{
|
{
|
||||||
acb_add_fmpz(s, s, cc, prec);
|
acb_add_fmpz(s, s, c + khi - k, prec);
|
||||||
}
|
}
|
||||||
else
|
else
|
||||||
{
|
{
|
||||||
acb_addmul_fmpz(s, xpow + r, cc, prec);
|
acb_addmul_fmpz(s, xpow + r, c + khi - k, prec);
|
||||||
}
|
}
|
||||||
|
|
||||||
if (r == 0 && k != 0)
|
if (r == 0 && k != 0)
|
||||||
acb_mul(s, s, xpow + m, prec);
|
acb_mul(s, s, xpow + m, prec);
|
||||||
|
|
||||||
PP(dd, n, k);
|
|
||||||
fmpz_divexact(cc, cc, dd);
|
|
||||||
QQ(dd, n, k);
|
|
||||||
fmpz_mul(cc, cc, dd);
|
|
||||||
|
|
||||||
k--;
|
k--;
|
||||||
}
|
}
|
||||||
|
|
||||||
acb_div_fmpz(s, s, cc, prec);
|
acb_div_fmpz(s, s, c + u, prec);
|
||||||
}
|
}
|
||||||
|
|
||||||
acb_add_ui(res, s, 1, prec);
|
acb_add_ui(res, s, 1, prec);
|
||||||
|
|
||||||
acb_clear(s);
|
acb_clear(s);
|
||||||
fmpz_clear(cc);
|
_fmpz_vec_clear(c, UNROLL + 1);
|
||||||
fmpz_clear(dd);
|
|
||||||
}
|
}
|
||||||
|
|
||||||
|
|
||||||
|
|
|
@ -11,58 +11,50 @@
|
||||||
|
|
||||||
#include "arb_hypgeom.h"
|
#include "arb_hypgeom.h"
|
||||||
|
|
||||||
#define BIG (1 << (FLINT_BITS / 2 - 2))
|
#define UNROLL 4
|
||||||
|
|
||||||
static void PP(fmpz_t r, ulong n, ulong k, ulong prime)
|
|
||||||
{
|
|
||||||
if (n < BIG && k < BIG)
|
|
||||||
{
|
|
||||||
fmpz_set_ui(r, (n - k + 1 - prime) * (n + k + prime));
|
|
||||||
}
|
|
||||||
else
|
|
||||||
{
|
|
||||||
fmpz_set_ui(r, n - k + 1 - prime);
|
|
||||||
fmpz_mul_ui(r, r, n + k + prime);
|
|
||||||
}
|
|
||||||
}
|
|
||||||
|
|
||||||
static void QQ(fmpz_t r, ulong n, ulong k, ulong prime)
|
|
||||||
{
|
|
||||||
if (k < BIG)
|
|
||||||
{
|
|
||||||
fmpz_set_ui(r, k * (k + prime));
|
|
||||||
}
|
|
||||||
else
|
|
||||||
{
|
|
||||||
fmpz_set_ui(r, k);
|
|
||||||
fmpz_mul_ui(r, r, k + prime);
|
|
||||||
}
|
|
||||||
}
|
|
||||||
|
|
||||||
static void
|
static void
|
||||||
sum_rs_inner(arb_t s, arb_srcptr xpow, slong m, ulong n, slong K, ulong prime, slong prec)
|
sum_rs_inner(arb_t s, arb_srcptr xpow, slong m, ulong n, slong K, ulong prime, slong prec)
|
||||||
{
|
{
|
||||||
slong j, k, khi, klo, u, r;
|
slong j, k, khi, klo, u, r;
|
||||||
fmpz_t cc, dd;
|
fmpz * c;
|
||||||
|
|
||||||
fmpz_init(cc);
|
|
||||||
fmpz_init(dd);
|
|
||||||
|
|
||||||
arb_zero(s);
|
arb_zero(s);
|
||||||
fmpz_zero(cc);
|
c = _fmpz_vec_init(UNROLL + 1);
|
||||||
|
|
||||||
k = K - 1;
|
k = K - 1;
|
||||||
while (k >= 1)
|
while (k >= 1)
|
||||||
{
|
{
|
||||||
u = FLINT_MIN(5, k);
|
u = FLINT_MIN(UNROLL, k);
|
||||||
|
|
||||||
khi = k;
|
khi = k;
|
||||||
klo = k - u + 1;
|
klo = k - u + 1;
|
||||||
|
|
||||||
PP(cc, n, khi, prime);
|
for (j = klo; j <= khi; j++)
|
||||||
for (j = klo; j < khi; j++)
|
|
||||||
{
|
{
|
||||||
PP(dd, n, j, prime);
|
ulong aa = (n - j + 1 - prime);
|
||||||
fmpz_mul(cc, cc, dd);
|
ulong bb = (n + j + prime);
|
||||||
|
|
||||||
|
if (j == klo)
|
||||||
|
fmpz_ui_mul_ui(c + khi - j, aa, bb);
|
||||||
|
else
|
||||||
|
fmpz_mul2_uiui(c + khi - j, c + khi - j + 1, aa, bb);
|
||||||
|
}
|
||||||
|
|
||||||
|
for (j = khi; j >= klo; j--)
|
||||||
|
{
|
||||||
|
ulong aa = (j);
|
||||||
|
ulong bb = (j + prime);
|
||||||
|
|
||||||
|
if (j == khi)
|
||||||
|
{
|
||||||
|
fmpz_ui_mul_ui(c + u, aa, bb);
|
||||||
|
}
|
||||||
|
else
|
||||||
|
{
|
||||||
|
fmpz_mul(c + khi - j, c + khi - j, c + u);
|
||||||
|
fmpz_mul2_uiui(c + u, c + u, aa, bb);
|
||||||
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
while (k >= klo)
|
while (k >= klo)
|
||||||
|
@ -71,28 +63,23 @@ sum_rs_inner(arb_t s, arb_srcptr xpow, slong m, ulong n, slong K, ulong prime, s
|
||||||
if (k == khi)
|
if (k == khi)
|
||||||
{
|
{
|
||||||
arb_add(s, s, xpow + r, prec);
|
arb_add(s, s, xpow + r, prec);
|
||||||
arb_mul_fmpz(s, s, cc, prec);
|
arb_mul_fmpz(s, s, c + khi - k, prec);
|
||||||
}
|
}
|
||||||
else if (r == 0)
|
else if (r == 0)
|
||||||
arb_add_fmpz(s, s, cc, prec);
|
arb_add_fmpz(s, s, c + khi - k, prec);
|
||||||
else
|
else
|
||||||
arb_addmul_fmpz(s, xpow + r, cc, prec);
|
arb_addmul_fmpz(s, xpow + r, c + khi - k, prec);
|
||||||
|
|
||||||
if (r == 0 && k != 0)
|
if (r == 0 && k != 0)
|
||||||
arb_mul(s, s, xpow + m, prec);
|
arb_mul(s, s, xpow + m, prec);
|
||||||
|
|
||||||
PP(dd, n, k, prime);
|
|
||||||
fmpz_divexact(cc, cc, dd);
|
|
||||||
QQ(dd, n, k, prime);
|
|
||||||
fmpz_mul(cc, cc, dd);
|
|
||||||
k--;
|
k--;
|
||||||
}
|
}
|
||||||
|
|
||||||
arb_div_fmpz(s, s, cc, prec);
|
arb_div_fmpz(s, s, c + u, prec);
|
||||||
}
|
}
|
||||||
|
|
||||||
fmpz_clear(cc);
|
_fmpz_vec_clear(c, UNROLL + 1);
|
||||||
fmpz_clear(dd);
|
|
||||||
}
|
}
|
||||||
|
|
||||||
void
|
void
|
||||||
|
|
|
@ -11,63 +11,55 @@
|
||||||
|
|
||||||
#include "arb_hypgeom.h"
|
#include "arb_hypgeom.h"
|
||||||
|
|
||||||
#define BIG (1 << (FLINT_BITS / 2 - 2))
|
#define UNROLL 4
|
||||||
|
|
||||||
static __inline__ void PP(fmpz_t r, ulong n, ulong k)
|
|
||||||
{
|
|
||||||
slong sigma = n % 2 ? 1 : -1;
|
|
||||||
ulong d = n / 2;
|
|
||||||
|
|
||||||
if (n < BIG && k < BIG)
|
|
||||||
{
|
|
||||||
fmpz_set_ui(r, (d - k + 1) * (2 * d + 2 * k + sigma));
|
|
||||||
}
|
|
||||||
else
|
|
||||||
{
|
|
||||||
fmpz_set_ui(r, d - k + 1);
|
|
||||||
fmpz_mul_ui(r, r, 2 * d + 2 * k + sigma);
|
|
||||||
}
|
|
||||||
}
|
|
||||||
|
|
||||||
static __inline__ void QQ(fmpz_t r, ulong n, ulong k)
|
|
||||||
{
|
|
||||||
slong sigma = n % 2 ? 1 : -1;
|
|
||||||
|
|
||||||
if (k < BIG)
|
|
||||||
{
|
|
||||||
fmpz_set_ui(r, k * (2 * k + sigma));
|
|
||||||
}
|
|
||||||
else
|
|
||||||
{
|
|
||||||
fmpz_set_ui(r, k);
|
|
||||||
fmpz_mul_ui(r, r, 2 * k + sigma);
|
|
||||||
}
|
|
||||||
}
|
|
||||||
|
|
||||||
static void
|
static void
|
||||||
sum_rs_inner(arb_t s, arb_srcptr xpow, slong m, ulong n, slong K, slong prec)
|
sum_rs_inner(arb_t s, arb_srcptr xpow, slong m, ulong n, slong K, slong prec)
|
||||||
{
|
{
|
||||||
slong j, k, khi, klo, u, r;
|
slong j, k, khi, klo, u, r;
|
||||||
fmpz_t cc, dd;
|
ulong d;
|
||||||
|
slong sigma;
|
||||||
|
fmpz * c;
|
||||||
|
|
||||||
fmpz_init(cc);
|
sigma = n % 2 ? 1 : -1;
|
||||||
fmpz_init(dd);
|
d = n / 2;
|
||||||
|
|
||||||
arb_zero(s);
|
arb_zero(s);
|
||||||
fmpz_zero(cc);
|
c = _fmpz_vec_init(UNROLL + 1);
|
||||||
|
|
||||||
k = K - 1;
|
k = K - 1;
|
||||||
while (k >= 1)
|
while (k >= 1)
|
||||||
{
|
{
|
||||||
u = FLINT_MIN(5, k);
|
u = FLINT_MIN(UNROLL, k);
|
||||||
|
|
||||||
khi = k;
|
khi = k;
|
||||||
klo = k - u + 1;
|
klo = k - u + 1;
|
||||||
|
|
||||||
PP(cc, n, khi);
|
for (j = klo; j <= khi; j++)
|
||||||
for (j = klo; j < khi; j++)
|
|
||||||
{
|
{
|
||||||
PP(dd, n, j);
|
ulong aa = (d - j + 1);
|
||||||
fmpz_mul(cc, cc, dd);
|
ulong bb = (2 * d + 2 * j + sigma);
|
||||||
|
|
||||||
|
if (j == klo)
|
||||||
|
fmpz_ui_mul_ui(c + khi - j, aa, bb);
|
||||||
|
else
|
||||||
|
fmpz_mul2_uiui(c + khi - j, c + khi - j + 1, aa, bb);
|
||||||
|
}
|
||||||
|
|
||||||
|
for (j = khi; j >= klo; j--)
|
||||||
|
{
|
||||||
|
ulong aa = (j);
|
||||||
|
ulong bb = (2 * j + sigma);
|
||||||
|
|
||||||
|
if (j == khi)
|
||||||
|
{
|
||||||
|
fmpz_ui_mul_ui(c + u, aa, bb);
|
||||||
|
}
|
||||||
|
else
|
||||||
|
{
|
||||||
|
fmpz_mul(c + khi - j, c + khi - j, c + u);
|
||||||
|
fmpz_mul2_uiui(c + u, c + u, aa, bb);
|
||||||
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
while (k >= klo)
|
while (k >= klo)
|
||||||
|
@ -76,28 +68,23 @@ sum_rs_inner(arb_t s, arb_srcptr xpow, slong m, ulong n, slong K, slong prec)
|
||||||
if (k == khi)
|
if (k == khi)
|
||||||
{
|
{
|
||||||
arb_add(s, s, xpow + r, prec);
|
arb_add(s, s, xpow + r, prec);
|
||||||
arb_mul_fmpz(s, s, cc, prec);
|
arb_mul_fmpz(s, s, c + khi - k, prec);
|
||||||
}
|
}
|
||||||
else if (r == 0)
|
else if (r == 0)
|
||||||
arb_add_fmpz(s, s, cc, prec);
|
arb_add_fmpz(s, s, c + khi - k, prec);
|
||||||
else
|
else
|
||||||
arb_addmul_fmpz(s, xpow + r, cc, prec);
|
arb_addmul_fmpz(s, xpow + r, c + khi - k, prec);
|
||||||
|
|
||||||
if (r == 0 && k != 0)
|
if (r == 0 && k != 0)
|
||||||
arb_mul(s, s, xpow + m, prec);
|
arb_mul(s, s, xpow + m, prec);
|
||||||
|
|
||||||
PP(dd, n, k);
|
|
||||||
fmpz_divexact(cc, cc, dd);
|
|
||||||
QQ(dd, n, k);
|
|
||||||
fmpz_mul(cc, cc, dd);
|
|
||||||
k--;
|
k--;
|
||||||
}
|
}
|
||||||
|
|
||||||
arb_div_fmpz(s, s, cc, prec);
|
arb_div_fmpz(s, s, c + u, prec);
|
||||||
}
|
}
|
||||||
|
|
||||||
fmpz_clear(cc);
|
_fmpz_vec_clear(c, UNROLL + 1);
|
||||||
fmpz_clear(dd);
|
|
||||||
}
|
}
|
||||||
|
|
||||||
static void
|
static void
|
||||||
|
|
|
@ -28,6 +28,10 @@ Convenience methods
|
||||||
|
|
||||||
Sets *z* to `x / 2^{exp}`, rounded away from zero.
|
Sets *z* to `x / 2^{exp}`, rounded away from zero.
|
||||||
|
|
||||||
|
.. function:: void fmpz_ui_mul_ui(fmpz_t x, ulong a, ulong b)
|
||||||
|
|
||||||
|
Sets *x* to *a* times *b*.
|
||||||
|
|
||||||
.. function:: void fmpz_ui_pow_ui(fmpz_t x, ulong b, ulong e)
|
.. function:: void fmpz_ui_pow_ui(fmpz_t x, ulong b, ulong e)
|
||||||
|
|
||||||
Sets *x* to *b* raised to the power *e*.
|
Sets *x* to *b* raised to the power *e*.
|
||||||
|
|
|
@ -172,6 +172,20 @@ _fmpz_size(const fmpz_t f)
|
||||||
return mpz_size(COEFF_TO_PTR(d));
|
return mpz_size(COEFF_TO_PTR(d));
|
||||||
}
|
}
|
||||||
|
|
||||||
|
static __inline__ void
|
||||||
|
fmpz_ui_mul_ui(fmpz_t r, ulong a, ulong b)
|
||||||
|
{
|
||||||
|
if (a < (UWORD(1) << (FLINT_BITS / 2)) && b < (UWORD(1) << (FLINT_BITS / 2)))
|
||||||
|
{
|
||||||
|
fmpz_set_ui(r, a * b);
|
||||||
|
}
|
||||||
|
else
|
||||||
|
{
|
||||||
|
fmpz_set_ui(r, a);
|
||||||
|
fmpz_mul_ui(r, r, b);
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
static __inline__ void
|
static __inline__ void
|
||||||
fmpz_ui_pow_ui(fmpz_t x, ulong b, ulong e)
|
fmpz_ui_pow_ui(fmpz_t x, ulong b, ulong e)
|
||||||
{
|
{
|
||||||
|
|
Loading…
Add table
Reference in a new issue